Kimi思考模型k1.5是怎么练成的?细节曝光
Baichuan-14B-M1 则是Baichuan-M1-preview的小尺寸版本也是业界首款从零开始专为医疗场景优化的开源大语言模型。在拥有卓越通用能力的同时,在医疗领域方面有着强大的性能。在大部分通用榜单评测中达到了同尺寸模型的效果,而在医疗场景中达到了5倍甚至更大的模型的效果。
Baichuan-14B-M1模型的核心特点:
-
从零开始基于 20万亿 token 的高质量医疗与通用数据训练。 -
针对 20+ 医疗科室 细粒度医疗专业建模。 -
引入 创新模型结构,显著提升上下文理解和长序列任务表现。 -
提供 Base 模型 和 Instruct 模型。
通过强化学习和偏序对数据的优化,提升模型生成质量、逻辑推理能力和用户偏好贴合度,这种多阶段与对齐优化相结合的方法,使模型在通用能力和医疗领域能力上均达到了卓越的水平。
https://github.com/baichuan-inc/Baichuan-M1-14B
(文:PaperAgent)