o1圈卷起来,百川智能开源Baichuan-M1-14B~

刚刚,百川智能体发布了国内首个全场景深度思考模型Baichuan-M1-preview,并开源了行业首个开源医疗增强大模型Baichuan-M1-14B。
国产o1-like大模型最近接连发布(kimi 1.5,DeepSeek R1),提前过年

Kimi思考模型k1.5是怎么练成的?细节曝光

Baichuan-M1-preview是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型,效果超越o1-preview。

Baichuan-14B-M1 则是Baichuan-M1-preview的小尺寸版本也是业界首款从零开始专为医疗场景优化的开源大语言模型。在拥有卓越通用能力的同时,在医疗领域方面有着强大的性能。在大部分通用榜单评测中达到了同尺寸模型的效果,而在医疗场景中达到了5倍甚至更大的模型的效果。

Baichuan-14B-M1模型的核心特点:

  • 从零开始基于 20万亿 token 的高质量医疗与通用数据训练。
  • 针对 20+ 医疗科室 细粒度医疗专业建模。
  • 引入 创新模型结构,显著提升上下文理解和长序列任务表现。
  • 提供 Base 模型 和 Instruct 模型。

通过强化学习和偏序对数据的优化,提升模型生成质量、逻辑推理能力和用户偏好贴合度,这种多阶段与对齐优化相结合的方法,使模型在通用能力和医疗领域能力上均达到了卓越的水平。

https://github.com/baichuan-inc/Baichuan-M1-14B

(文:PaperAgent)

欢迎分享

发表评论