强化学习归档 - 第23页共24页

Kimi版o1实装上线，这里是我们的一手测试↑

下午10时 2024/12/16 作者量子位

Kimi新模型k1发布即上线可用，视觉与推理能力出众。基于强化学习，k1能够深入理解图片信息并进行思维链推理，涵盖数学、物理及化学题。数理化实测中表现出色，超越OpenAI等模型。

下午6时 2024/12/16 作者多知

Kimi发布视觉思考模型k1，支持拍照解题并提供全过程解答。该模型在数学、物理等基础科学领域表现优于OpenAI o1、GPT-4等标杆模型。

下午6时 2024/12/16 作者新智元

MAPLE实验室提出通过强化学习优化扩散模型和流匹配模型的多步去噪过程，实现用更少步骤生成高质量图像，并显著减少约50%推理步数。

下午4时 2024/12/16 作者机器之心

机器之心报道
编辑：杜伟、小舟
这几天，学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会

下午12时 2024/12/16 作者钛媒体AGI

12月6日-7日，2024 T-EDGE创新大会暨钛媒体财经年会在北京市大兴区举办。2024 T-E

上午8时 2024/12/15 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨吴佳龙
来源丨THUML
编辑丨极市平台
极市导读
本文提出一种

下午12时 2024/12/14 作者 AI寒武纪

Ilya燃爆NeurIPS 2024 ，最新演讲来了
我们现在如此依赖的强大人工智能，在未来的某一天

下午8时 2024/12/13 作者乌鸦智能说

你知道，今年上半年AI行业股价涨得最多的公司是谁吗？
不是搞芯片的英伟达，也不是投了OpenAI的微

下午2时 2024/12/13 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

下午2时 2024/12/09 作者量子位

北京交通大学团队推出O1-CODER模型，专注于编码任务。该模型结合了强化学习与蒙特卡洛树搜索，显著提升了代码生成质量。研究发现，通过生成推理数据并优化策略模型，测试用例生成器的性能得到提升，平均采样通过率达到了89.2%。