MistralAI 刚发布了新模型—— Mistral-Small-3.2-24B-Instruct-2506。从跑分上看文本能力有巨大的提升:包括指令遵循,聊天,语气等。不过性能上没啥大变化,MMLU Pro 提升了大约3%,GPQA-Diamond 提升了不到0.5%,SImpleQA提升了大约2%。
目前 MistralAI 的模型最大的用处应该还是自己微调后用于特定领域。由于都是稠密模型,因此微调起来比 MoE 省事。


参考文献:
[1] 模型地址:https://huggingface.co/mistralai/Mistral-Small-3.2-24B-Instruct-2506
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)