Evaluation Leaderboard

Interactive benchmark results viewer

Showing: 58

Total: 58

Benchmarks: 18

Checkpoint	Visual_LC_Avg	LC_Avg	Overall_Avg	mmlongbench_doc	mmlongbench_doc_corrected	mmlb_131k	mmlb_32k	spiqa_eval	slidevqa	helmet	longbench_v2	dude	tablevqa	mmmu_pro	tinymmlu	mm_mt_bench	gpqa	tinygsm8k

Data Composition