MistralAI新模型：Mistral-Small-3.2-24B-Instruct-2506

MistralAI 刚发布了新模型—— Mistral-Small-3.2-24B-Instruct-2506。从跑分上看文本能力有巨大的提升：包括指令遵循，聊天，语气等。不过性能上没啥大变化，MMLU Pro 提升了大约3%，GPQA-Diamond 提升了不到0.5%，SImpleQA提升了大约2%。

目前 MistralAI 的模型最大的用处应该还是自己微调后用于特定领域。由于都是稠密模型，因此微调起来比 MoE 省事。

参考文献：
[1] 模型地址：https://huggingface.co/mistralai/Mistral-Small-3.2-24B-Instruct-2506

知识星球服务内容：Dify源码剖析及答疑，Dify对话系统源码，NLP电子书籍报告下载，公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。

（文：NLP工程化）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

发表评论取消回复