资讯
国际
分享
大模型
学术
开源
机器人
关于我们

13GB显存

DeepSeek重磅发布NSA原生稀疏注意力：梁文峰团队核心突破Transformer瓶颈！效率飙升10倍！

下午2时 2025/02/19 作者子非AI

一举突破
Transformer 注意力机制瓶颈！
梁文峰团队领衔研发
的 NSA 采用
原生稀疏

分类分享标签 13GB显存、 32k上下文长度、 Native Sparse Attention、动态稀疏性、硬件对齐、端到端训练发表评论

搜索

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

近期文章

时隔一年，再次使用7个国产AI大模型写高考作文，国产模型的进步也太大了！有彩蛋。
小红书开源大模型dots.llm1，初次出手，小有惊艳！国外网友们又炸了……
18天光速打脸！OpenAI刚夸TypeScript最合适，转头就用Rust重写Codex CLI
别被MCP的包装骗了！重构系统、向智能体转型，CEO亲述：关键时刻还是RPA兜底？
你永远叫不醒装睡的大模型！多轮对话全军覆没，性能暴跌39%

分类

分享
国际
大模型
学术
开源
机器人
资讯

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

« 5 月

归档

2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×