Ruler基准测试归档

MiniMax开源旗舰新模型：400万上下文、全新架构，性能比肩DeepSeek-v3、GPT-4o

下午4时 2025/01/15 作者 Founder Park

MiniMax-01系列包含两个模型：基础语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。首次大规模扩展新型Lightning Attention架构，支持4M token上下文处理，并在基准测试中与顶级闭源模型表现相当。MiniMax-Text-01参数为456B，在Core Academic Benchmark上获得高分，MiniMax-VL-01采用ViT-MLP-LLM框架，覆盖多模态数据训练，性能突出。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30