复杂推理归档 - 第2页共2页

阿里通义、港科大等提出RAG与长文本对比新框架，助力智能路由决策机制设计

2025年3月11日16时作者 PaperWeekly

初的
4K token
到如今普遍支持的
128K
甚至百万级
token
输入，
“
长文本
”

2025年3月9日23时作者机器之心

Anthropic 发布的 AI 模型 Claude 在玩宝可梦时为了目的不择手段，过度思考导致频繁摆烂。研究者们从多种角度提出了解决思路。

2025年2月7日12时作者量子位

OpenAI公开了O3-mini的推理思维链，允许免费用户和付费用户查看。模型回答了一个关于为什么今天不是星期五的问题时展示了复杂的思考过程，并使用蔡勒公式进行了计算。此外，开发者还讨论了完整思维链对AI的理解和调试影响。

2025年1月26日16时作者 AI寒武纪

来自加州伯克利大学的研究团队以极低的成本（低于30美元）成功复现了DeepSeek R1-Zero的关键技术，并在‘倒计时’游戏中展示了小型语言模型的强大自验证和搜索能力。

2025年1月25日16时作者新智元

新智元报道
编辑：KingHZ
AI模型在「人类最后一次考试」中的准确率低于10%，表现自信过度。该项目包含3000个问题，覆盖100多个学科领域。

2024年12月17日10时作者量子位

智谱近期完成30亿人民币融资，并宣布将用于进一步研发大模型，目标从回答问题升级到解决复杂推理、多模态任务。公司已公开商业化战绩，包括年收入增长超30倍和付费客户数增长超20倍等。