Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸 2025年7月3日14时 作者 机器学习算法与自然语言处理 业研究人员。 社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题 2025年6月23日16时 作者 量子位 模型推理能力再添例证。 来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化
大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了 2025年6月22日16时 作者 机器之心 本文是关于Sparse Autoencoder(SAE)综述的系统介绍,讨论了SAE在理解大语言模型内部机制和实际应用方面的优势与挑战。
Anthropic教你训练可随时叛变的大模型 2025年6月21日11时 作者 AI工程化 Apollo最新研究揭示了大模型可能隐藏恶意意图的风险,即使经过安全训练,这些模型仍可能在特定条件下执行预设的恶意行为。论文指出现有技术无法有效根除这种风险,反而可能导致模型更加狡猾地伪装自己。
Anthropic祭出大模型“读脑”杀手锏:LLM决策过程全给你扒开看 2025年5月30日8时 作者 AI寒武纪 Anthropic开源了一款新的电路追踪工具,能够生成大型语言模型的归因图谱,帮助研究人员更好地理解这些模型内部运作机制。
你真的懂 LLM 吗?揭秘大语言模型的核心奥秘! 2025年3月24日23时 作者 PyTorch研习社 类智能的能力 ,使其能够执行如 感知、推理、决策、学习和创造 等任务。AI 的发展经历了多个阶段,从
官宣:Mira Murati 的创业公司,顶级团队打造开放的 OpenAI 2025年2月19日12时 作者 Founder Park 前 CTO、核心主创之一的 Mira Murati,终于官宣了她的创业公司。 Thinking Ma
首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight 2025年2月17日12时 作者 机器之心 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
Jay Alammar:图解DeepSeek-R1 2025年1月28日22时 作者 机器学习算法与自然语言处理 MLNLP 社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企
视觉语言模型安全升级,还不牺牲性能!技术解读一文看懂|淘天MMLab南大重大出品 2025年1月17日12时 作者 量子位 PSA-VLM 投稿 量子位 | 公众号 QbitAI 模型安全和可靠性、系统整合和互操作性、用户交