阿里发现新方法:仅用小纸条和错题本,就能使数学近满分、code能力翻番…

MLNLP社区是国内外知名的人工智能社区,致力于促进机器学习与自然语言处理领域的学术交流和技术进步。近期发布了有关LLM如何通过自我学习和工具调用提升推理能力的论文。START模型能自动调用Python等外部工具解决复杂问题,未来AI或将随身携带各种工具箱。

马斯克评价 DeepSeek:中国大部分时间都是世界最强国家,但……

MLNLP社区是国内外知名机器学习与自然语言处理社区,致力于促进学术界、产业界和个人间的交流和进步。马斯克表示期待中国在AI领域取得成就,但认为已有公司即将发布更先进的模型。

困在“第一学历”里的博士

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作,但学历歧视问题依然存在,如企业招聘时卡学校层次或看重第一学历。教育部发布通知禁止此类行为,并建议规范就业歧视内涵。强调学历并非唯一标准,应鼓励终身学习和人才合理使用。

从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO

MLNLP是国内外知名的人工智能社区,致力于促进机器学习与自然语言处理领域的学术交流和技术进步。文章讨论了Reinforce++和GRPO作为PPO变体的应用及其改进,包括去除critic模型、使用远程奖励模型以及在GRPO基础上优化KL估计方法等技术进展。

DeepSeek官方发布R1模型推荐设置,这才是正确用法

MLNLP社区是一个国内外知名的机器学习与自然语言处理社区,旨在促进学术界、产业界和爱好者的交流与进步。近日,DeepSeek推荐了其官方部署设置,包括不使用系统提示词、温度参数设置为0.6等建议。