MiniMax开源旗舰新模型:400万上下文、全新架构,性能比肩DeepSeek-v3、GPT-4o
MiniMax-01系列包含两个模型:基础语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。首次大规模扩展新型Lightning Attention架构,支持4M token上下文处理,并在基准测试中与顶级闭源模型表现相当。MiniMax-Text-01参数为456B,在Core Academic Benchmark上获得高分,MiniMax-VL-01采用ViT-MLP-LLM框架,覆盖多模态数据训练,性能突出。