跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

日期: 2025 年 5 月 15 日

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

2025年5月15日23时 作者 量子位

论文
,来了!
这一次,团队把DeepSeek-V3在训练和推理过程中,如何解决
“硬件瓶颈”
的方

分类 资讯 标签 3D内存、 下一代AI硬件、 低精度计算、 作者名、 自愈网络、 链路层重试 发表评论

刚刚,DeepMind通用科学智能体AlphaEvolve突破数学极限,陶哲轩合作参与

2025年5月15日23时 作者 机器之心

个由 LLMs 驱动的革命性进化编码智能体。
它不仅仅是一个代码生成工具,更是一个能够演化
整个代码

分类 学术、 资讯 标签 AlphaEvolve、 Strassen算法、 Transformer模型、 亲吻数问题、 张量处理单元、 数据中心调度 发表评论

42岁软件工程师,因AI裁员!千份简历石沉大海,送外卖维生

2025年5月15日23时 作者 新智元

I自主化,2027年AI或能完全自主编程,开启智能爆炸时代,而这一切正悄然改变就业市场,软件工程师肖

分类 资讯 标签 AI、 全球合作、 再就业援助、 失业风险、 教育改革、 社会福利 发表评论

养老基金抛弃马斯克|

2025年5月15日23时 作者 甲子光年

美国当地时间4月30日,据《华尔街日报》报道,一些投资者对公司CEO马斯克投身政治感到不满,特斯拉

分类 资讯 标签 公众形象、 公司治理挑战、 养老金基金、 减持行为、 特斯拉、 管理层建设 发表评论

超越OpenAI、ElevenLabs,MiniMax新一代语音模型屠榜!人格化语音时代来了

2025年5月15日23时 作者 机器之心

-R1 爆火,以超低的成本实现了部分超越 OpenAI o1 的表现,一定程度上让人不再过度「迷信」

分类 学术、 资讯 标签 AI模型、 MiniMax、 个性化声音、 多样化语言、 情感化交互、 语音大模型 发表评论

梁文锋新论文!DeepSeek降本秘籍公开,突破算力瓶颈有六招

2025年5月15日23时 作者 智东西

智东西5月15日消息,昨日下午,DeepSeek团队发布新论文,以DeepSeek-V3为代表,深

分类 资讯 标签 DeepSeek-V3、 动态路由方案、 大模型、 效率提升、 软硬件设计、 错误检测机制 发表评论

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元!

2025年5月15日23时 作者 机器之心

生成、大语言模型推理等。在国际顶级会议和期刊如 AAAI,SIGIR,TOIS 等发表多篇论文,代表

分类 学术、 资讯 标签 DeepSeek-R1、 WebThinker、 强化学习训练、 深度网页探索器、 知识密集型任务、 自主思考-搜索-写作 发表评论

DeepSeek-V3再发论文,梁文锋署名,低成本训练大模型的秘密揭开了

2025年5月15日23时 作者 机器之心

eek 已经发布了 V3 模型的
技术报告
,但刚刚,他们又悄然发布了另一篇围绕 DeepSeek-

分类 学术、 资讯 标签 DRAM堆叠加速器、 Transformer模型、 内存瓶颈、 晶圆级集成系统、 混合模型、 超高计算效率 发表评论

Speech-02语音模型登顶国际榜单:完美复刻声音,同事听后难辨真伪

2025年5月15日19时 作者 归藏的AI工具箱

文章介绍了藏师傅使用AI听书功能体验后对MiniMax Speech模型Speech-02的评价,强调其在ELO评价榜单上的表现优异,并详细描述了该模型的主要创新点和技术优势。

分类 分享 标签 Artificial Analysis、 ELO评价、 MiniMax、 Speech-02、 藏师傅、 起点听书 发表评论

单机H200最快DeepSeek V3和R1推理系统优化秘籍

2025年5月15日19时 作者 GiantPandaCV

optim-algorithm-in-cuda/blob/master/large-language

分类 学术 标签 CUDA Stream重叠操作、 DeepSeek V3/R1、 FP8量化、 SGLang、 Triton、 层间复用 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 页面4 … 页面10 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 刚刚,扎克伯格宣布成立Meta超级智能新实验室
  • 一句话P图:ComfyUI OmniGen2 原生工作流
  • 苹果或搁置自研模型,转向依赖OpenAI或Anthropic
  • 原来这才是 Claude Code 的正确打开方式!8 个招式教你搞定 AI 编程
  • 个人音频转录与交互神器

2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月   6 月 »

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×