R1强化学习策略用在多模态推理开源实现:兼看社区不可思议被侵权之遇 下午2时 2025/02/20 作者 老刘说NLP 今天是2025年02月20日,星期四。文章提到了NLP社区的一则有趣事件,并讨论了R1在多模态推理中的进展,包括视频和图像处理的相关工作及技术细节。