另一个国产AI开源“猛兽”:400万tokens上下文的MiniMax-01模型,来了!
木易在公众号分享MiniMax-01系列模型的相关信息,包括通用文本模型和多模态模型的基本参数、性能测试结果以及使用方式等,并介绍了MiniMax在国内及海外的两个核心产品:星野和海螺AI。
木易在公众号分享MiniMax-01系列模型的相关信息,包括通用文本模型和多模态模型的基本参数、性能测试结果以及使用方式等,并介绍了MiniMax在国内及海外的两个核心产品:星野和海螺AI。
MiniMax-01系列包含两个模型:基础语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。首次大规模扩展新型Lightning Attention架构,支持4M token上下文处理,并在基准测试中与顶级闭源模型表现相当。MiniMax-Text-01参数为456B,在Core Academic Benchmark上获得高分,MiniMax-VL-01采用ViT-MLP-LLM框架,覆盖多模态数据训练,性能突出。