跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

注意力机制

OpenAI o1如何炼成?原理逆向工程图解

2024年12月21日14时 作者 机器学习算法与自然语言处理

MLNLP
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企

分类 学术 标签 MCST树搜索、 o1模型、 多模态学习、 思考因子、 注意力机制、 自回归模型 发表评论

让多视角图像生成更轻松!北航和VAST推出MV-Adapter

2024年12月18日14时 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 3D纹理生成、 MV-Adapter、 任意视角生成、 光线图、 注意力机制、 消融实验 发表评论

Ilya Sutskever连续三年获NeurIPS 终身成就奖

2024年12月14日8时 作者 AGI Hunt

AI界传奇人物Ilya Sutskever因发表的论文’Sequence to Sequence Learning with Neural Networks’获得NeurIPS最高荣誉。该论文展示了序列学习的革命性方法,并在自然语言处理领域影响深远。

分类 分享 标签 Ilya Sutskever、 LSTM、 NeurIPS、 seq2seq模型、 注意力机制、 深度学习 发表评论

LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

2024年12月13日12时 作者 新智元

新智元报道
编辑:LRS
【新智元导读】
Transformer模型自2017年问世以来,已成为AI

分类 资讯 标签 Jürgen Schmidhuber、 Manduchi、 Tomasi、 Transformer、 多头注意力、 注意力机制 发表评论

中科院最新综述|万字长文搞懂车道线检测

2024年12月12日8时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨Xin He等
来源丨自动驾驶之心
编辑丨极市平台
极市导读
本

分类 学术 标签 任务范式、 参数化模型、 注意力机制、 深度学习、 相机透视效应、 车道线检测 发表评论

NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖

2024年12月11日14时 作者 新智元

新智元报道
编辑:编辑部 HYZj
【新智元导读】
NeurIPS 2024最佳论文终于正式揭晓了!

分类 资讯 标签 LLM助手、 NeurIPS、 多模态信息集成、 最佳论文奖、 梯度自适应方法、 注意力机制 发表评论

UCL、上交大等提出自然语言强化学习范式:可处理语言反馈的强化学习框架

2024年12月10日8时 作者 PaperWeekly

©作者 |
刘博
单位 |
新加坡国立大学
来源 |
机器之心
本论文由伦敦大学学院、上海交通大学、

分类 大模型、 学术 标签 公开数据集、 图像分类、 多尺度特征提取、 改进卷积神经网络、 注意力机制、 深度学习 发表评论

1-bit大模型还能再突破!新一代BitNet架构启用4位激活值

2024年12月5日11时 作者 新智元

BitNet系列原班人马推出新一代架构BitNet a4.8,采用两阶段权重衰减和学习率调度。实验对比显示其在语言模型困惑度和任务准确性方面与LLaMA相当,并且平均精度几乎没有损失。

分类 资讯 标签 BitNet a.8、 FP16架构、 困惑度、 注意力机制、 混合量化、 稀疏化策略 发表评论

揭秘注意力机制真正起源!10年前3项研究几乎同时独立提出,背后故事细节被Karpathy晒邮件公开了

2024年12月4日16时 作者 量子位

2014年来自Karpathy与Dzmitry Bahdanau的实习生提出的简化注意力机制在机器翻译项目中诞生,后来被应用于Transformer模型。

分类 资讯 标签 Bahdanau、 Bengio、 Transformer、 智能未来、 李开复、 注意力机制 发表评论

被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

2024年12月4日16时 作者 机器之心

机器之心报道
编辑:Panda
几个小时前,著名 AI 研究者、OpenAI 创始成员之一 Andr

分类 学术、 资讯 标签 Transformer模型、 序列到序列学习、 注意力机制、 神经图灵机、 记忆网络、 长短期记忆网络 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面3 页面4 页面5 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 2025年AI高考志愿填报工具测评:四大主流产品对比分析
  • Google 现在正在测试 AI 音频片段来回答搜索查询
  • 出门问问发了新硬件,AIGC第一股急需新故事
  • 你希望AI学会沉默吗? 每日一AI
  • 停更半年后,他靠AI《致富经》涨粉50万、商单收入翻番 AI玩家对话

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×