机器之心，作者每时AI - 第64页共106页

重磅发现！DeepSeek R1方法成功迁移到视觉领域，多模态AI迎来新突破！

下午11时 2025/02/20 作者机器之心

VLM-R1 是一个将 DeepSeek R1 方法应用于视觉语言模型的新开源项目，展示了其在稳定性、泛化能力等方面的优越性能，并提供简单易用的训练流程。

史上最惊悚的机器人，看了让人睡不着，网友：像新鲜的尸体在抽搐

下午11时 2025/02/20 作者机器之心

的机器人出生不久就站上了春晚舞台给全国人民送祝福，而有的机器人刚来到人类世界五分钟就选择了上吊。
如

量子计算里程碑！微软单芯片可百万量子比特，Nature研究爆火

下午12时 2025/02/20 作者机器之心

微软宣布造出了一款前所未有的量子计算芯片 Majorana 1，并称可以在单块芯片上让数百万量子比特

复旦主导，中美等8个国家25家单位44名学者联合发布大模型安全技术综述

下午12时 2025/02/20 作者机器之心

AIxiv专栏发布了一篇系统性技术综述论文《Safety at Scale: A Comprehensive Survey of Large Model Safety》，全面调研了大模型安全领域的390篇研究工作，涵盖6种主流大模型和10种攻击类型。该论文介绍了各类模型的攻击与防御方法，并归纳了常用的数据集和评估基准，总结了4个重要研究趋势及主要挑战，呼吁学术界与国际社会加强合作，共同应对大模型安全问题。

OpenAI：强化学习确实可显著提高LLM性能，DeepSeek R1、Kimi k1.5发现o1的秘密

下午11时 2025/02/19 作者机器之心

IOI 上达到了金牌水平，并且在 CodeForces 上获得了与精英级人类相当的得分。
他们是怎

大模型强化学习新发现：删减84%数据反提升效果

下午11时 2025/02/19 作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

撞车DeepSeek NSA，Kimi杨植麟署名的新注意力架构MoBA发布，代码也公开

下午4时 2025/02/19 作者机器之心

机制 NSA；加上还有创始人兼 CEO 梁文锋亲自参与，一时之间吸引眼球无数，参阅报道《
刚刚！De

清华团队构建大型社会模拟器AgentSociety，推动智能社会治理与研究范式变革

下午12时 2025/02/19 作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

Claude挣钱强于o1！OpenAI开源百万美元编码基准，检验大模型钞能力

下午12时 2025/02/19 作者机器之心

OpenAI 推出并开源 SWE-Lancer 基准测试，用于评估 AI 大模型在现实世界软件工程任务中的表现。包含 1400 多个自由软件工程任务，总价值 100 万美元。包括自家 GPT-4o、o1 和 Anthropic Claude 3.5 Sonnet 在内的前沿模型未能解决大多数任务，仅 Claude 3.5 Sonnet 拿到最高报酬 403,325 美元。

DeepSeek V3+R1满血微调工具上线！一键启动，硬件要求降10倍

下午12时 2025/02/19 作者机器之心

Colossal-AI 发布了大模型后训练工具箱，包含低成本监督微调解决方案及强化学习工具链等。通过 Colossal-AI 的一键启动脚本，用户可以快速完成 DeepSeek V3/R1 模型的微调，并支持多种硬件配置。同时，团队还验证并实现了 GRPO 算法及奖励设计方法用于深度学习模型优化。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30