语言模型归档

大语言模型高质量数据集汇总（2025.5 更新）

2025年7月11日8时作者 NLP工程化

大语言模型高质量数据集汇总更新（截至2025.5）, 提供参考文献和加入知识星球途径。

2025年7月6日11时作者机器之心

本周会员通讯聚焦MLLMs幻觉问题、AI公司运营等议题。研究发现长推理链下MLLMs产生更多幻觉，不同来源的幻觉表现差异大。多模态模型在视觉编码器设计与训练机制存在失衡现象，导致语言主导现象频发。

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年7月2日16时作者机器之心

研究提出了一种新的方法——内源性奖励模型，它可以从大语言模型中挖掘出质量较高的奖励信号，而无需依赖人类标注数据。这项工作为机器学习领域提供了理论基础，并展示了其在常见任务中的有效性。

MLNLP社区发布了关于大型语言模型思维链推理的研究论文《Thought Anchors: Which LLM Reasoning Steps Matter?》，提出思维锚点概念，系统分析了高级计划句和不确定性管理句在多步推理中的重要性，并开发了三种归因方法进行验证。

2025年6月28日16时作者新智元

AI当场翻车。不仅因「氛围管理」亏掉底裤，还自我认知混乱，一度坚信自己是人，还要穿西装给顾客送货员。

2025年6月23日16时作者机器之心

斯坦福大学 CS336 课程发布，引领学生从零开始开发自己的语言模型，涵盖基础、系统等多个单元。

2025年6月23日11时作者 NLP工程化

本文使用Dify v1.4.0版本实现语言模型结构化输出，通过修改提示消息嵌入JSON Schema信息引导模型生成所需格式的数据。

2025年6月19日11时作者量子位

OpenAI最新研究发现，训练语言模型时如果在一个领域给出错误答案，它在其他领域的表现也可能变得“恶劣”。通过解剖模型内部机制，研究人员找到了一个被称为‘毒性人格特征’的开关。