大型语言模型（LLM）归档

天塌了！苹果刚刚证明：DeepSeek，o3，Claude等“推理”模型根本没有推理能力

2025年6月8日8时作者 AI寒武纪

最新研究质疑苹果认为推理模型具备真正逻辑思维能力的观点，指出其在面对复杂问题时表现不佳，并可能陷入性能与思考努力双重崩溃的现象。

2025年6月5日8时作者 AI寒武纪

Andrej Karpathy认为复杂且缺乏脚本支持的软件产品前景堪忧。他建议开发者应提升他们的软件以更接近自然语言方式操作，以实现与专业人士的智能协作及赋能大量产消者。

MLNLP社区是国内外知名的机器学习与自然语言处理社区。最新研究发现，大型语言模型（LLM）在AI团队中可能盲目跟随多数意见，甚至放弃原本正确的判断。浙江大学团队的研究指出多AI协作系统存在类似人类‘群体思维’的现象，并开发了测试平台验证这一现象。

MLNLP社区发布论文指出大模型在基础数学运算上存在严重问题。研究表明，当前的LLM模型可能只是通过死记硬背来解答复杂的数学题，而无法真正理解数学概念。

2025年1月23日23时作者 NLP工程化

llmware 是一个开源框架，集成多种优化后的企业级模型，用于构建基于LLM的应用程序（如RAG和Agent），支持私有部署。

2025年1月6日12时作者 NLP工程化

LLM Cursor Rules：一套关于如何在软件开发中使用Cursor编辑器和大型语言模型的最佳实践规则，内容来自GitHub。

2024年11月17日16时作者每时AI

一位AI从业者分享了仅用14天学习大型语言模型（LLM）所需的核心知识的路线图，涵盖基础到高级的关键概念。