跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

可解释性

Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸

2025年7月3日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 LLM、 九头蛇效应、 冗余路径、 可解释性、 因果验证 发表评论

只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题

2025年6月23日16时 作者 量子位

模型推理能力再添例证。
来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化

分类 资讯 标签 可控化、 可解释性、 多模态推理、 实际应用、 解释性增强、 透明度 发表评论

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

2025年6月22日16时 作者 机器之心

本文是关于Sparse Autoencoder(SAE)综述的系统介绍,讨论了SAE在理解大语言模型内部机制和实际应用方面的优势与挑战。

分类 学术、 资讯 标签 Sparse Autoencoder、 可解释性、 吴烜圣、 杜梦楠、 束东、 赵海燕 发表评论

Anthropic教你训练可随时叛变的大模型

2025年6月21日11时 作者 AI工程化

Apollo最新研究揭示了大模型可能隐藏恶意意图的风险,即使经过安全训练,这些模型仍可能在特定条件下执行预设的恶意行为。论文指出现有技术无法有效根除这种风险,反而可能导致模型更加狡猾地伪装自己。

分类 分享 标签 Apollo、 免疫系统、 内部安全性、 可解释性、 后门植入、 思维链技术 发表评论

Anthropic祭出大模型“读脑”杀手锏:LLM决策过程全给你扒开看

2025年5月30日8时 作者 AI寒武纪

Anthropic开源了一款新的电路追踪工具,能够生成大型语言模型的归因图谱,帮助研究人员更好地理解这些模型内部运作机制。

分类 国际、 资讯 标签 Anthropic、 Dario Amodei、 Gemma-2-2b、 可解释性、 归因图谱、 电路追踪工具 发表评论

你真的懂 LLM 吗?揭秘大语言模型的核心奥秘!

2025年3月24日23时 作者 PyTorch研习社

类智能的能力
,使其能够执行如
感知、推理、决策、学习和创造
等任务。AI 的发展经历了多个阶段,从

分类 分享 标签 DeepSeek、 RAG、 可解释性、 安全隐患、 幻觉问题、 模型对齐 发表评论

官宣:Mira Murati 的创业公司,顶级团队打造开放的 OpenAI

2025年2月19日12时 作者 Founder Park

前 CTO、核心主创之一的
Mira Murati,终于官宣了她的创业公司。
Thinking Ma

分类 资讯 标签 AI 创业、 中美对比、 可解释性、 大模型预训练、 技术创新、 研发成本 发表评论

首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight

2025年2月17日12时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 ToST、 可解释性、 多模态融合、 大模型实现、 注意力机制、 统计特性 发表评论

Jay Alammar:图解DeepSeek-R1

2025年1月28日22时 作者 机器学习算法与自然语言处理

MLNLP
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企

分类 学术 标签 DeepSeek-R1、 可解释性、 强化学习、 混合专家层、 监督微调、 示范长链推理 发表评论

视觉语言模型安全升级,还不牺牲性能!技术解读一文看懂|淘天MMLab南大重大出品

2025年1月17日12时 作者 量子位

PSA-VLM 投稿
量子位 | 公众号 QbitAI
模型安全和可靠性、系统整合和互操作性、用户交

分类 资讯 标签 PSA-VLM、 可控性、 可解释性、 安全性、 概念瓶颈架构、 社会价值 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 彻底压榨潜能!我用 Kimi K2 写了一套前端组件库
  • “我爱它,但我的部分内心又有些害怕它”:Trap 音乐制作人发布基于其音乐风格的生成式 AI 模型 ​
  • “—个让AI停止当舔狗的妙招”
  • 我在抖音做AI特效,上百万人使用,最高月入超6万 对话
  • 推荐慢思考前沿研究速览

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×