横空出世!MiniMax 放出4百万token怪兽,击败Deepseek V3!开源大模型迎来新巅峰
MiniMax团队发布了MiniMax-Text-01开源大模型,拥有456B参数量、100万训练上下文长度及400万推理上下文长度。该模型在多项基准测试中表现优异,并提供了开放下载的模型权重、完整的在线体验空间和商业使用许可。
MiniMax团队发布了MiniMax-Text-01开源大模型,拥有456B参数量、100万训练上下文长度及400万推理上下文长度。该模型在多项基准测试中表现优异,并提供了开放下载的模型权重、完整的在线体验空间和商业使用许可。
MiniMax-01系列包含两个模型:基础语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。首次大规模扩展新型Lightning Attention架构,支持4M token上下文处理,并在基准测试中与顶级闭源模型表现相当。MiniMax-Text-01参数为456B,在Core Academic Benchmark上获得高分,MiniMax-VL-01采用ViT-MLP-LLM框架,覆盖多模态数据训练,性能突出。