再看行业R1模型如何构建及减少推理大模型过度思考 下午2时 2025/03/23 作者 老刘说NLP 今天是2025年3月23日,星期日。文章介绍了Fin-R1模型在金融领域的应用及其构建路线,包括数据处理和训练方法,并总结了减少推理大模型过度思考的技术方案。
Fin-R1:通过强化学习驱动的金融推理大模型 上午8时 2025/03/23 作者 PyTorch研习社 张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合财跃星辰研发并开源发布。