自然语言处理归档 - 第2页共15页

实证：现在的LLM根本不会Reasoning！

MLNLP社区致力于推动国内外自然语言处理领域的学术与行业发展。最新论文指出，热门的大推理模型可能只是在’表演思考’。该论文通过特定谜题揭示了这类模型的问题复杂度上限，并提出了改进方向。

2025年6月9日23时作者机器之心

本文研究知识蒸馏中FKLD和RKLD的次优表现，提出α-β散度框架ABKD来平衡难度集中与置信集中效应。通过实验验证了ABKD的有效性，并提出了敏感性分析以进一步优化模型性能。

2025年6月9日8时作者 AIGC开放社区

Meta考虑投资超过100亿美元的Scale AI，后者提供数据标注服务，主要客户包括OpenAI、微软、谷歌等科技巨头。

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年6月7日11时作者新智元

写代码能力更强了，还能连续干活7小时不出大差错！AGI真要来了？这背后到底发生了什么？现在，还有机会

2025年6月5日8时作者 APPSO

阿里巴巴推出最新AI助手Qwen，旨在提供更高效、智能的服务和支持。

2025年5月30日14时作者 AI信息Gap

DeepSeek R1 推出升级版，推理能力增强、幻觉率下降、支持函数调用，并引入8B小模型辅助教学。新版性能提升显著，已超越开源之王Qwen3。

2025年5月29日19时作者 AI先锋官

DeepSeek官方近日宣布已完成DeepSeek R1模型的小版本试升级，并在HuggingFace上开源了新版本。该模型在代码生成方面提升显著，性能接近OpenAI的模型且超越Claude-4-Sonnet，但推理能力稍有不足。