H100 GPU 归档 - 每时AI

扩散语言模型写代码！速度比自回归快10倍

2025年7月10日12时作者量子位

Inception Labs发布Mercury模型，采用扩散技术一次性生成代码并纠正错误。它比传统工具快10倍，支持多语言语法树嵌入和双向注意力机制。该模型在线可试用。

2025年5月2日8时作者开源星探

一款名为Aero-1-Audio的新型音频模型发布，参数仅有1.5B但性能出色，支持长音频处理、语音识别和音频理解任务。训练时间短且资源占用低，适用于语音助手、实时转写等场景。

2025年4月9日14时作者 GiantPandaCV

表到本公众号。
让向量求和变得非常快
06 Apr, 2025
在这篇博客文章中，我们将简要描述如何

2025年2月18日8时作者 NLP工程化

从零实现DeepSeek R1的强化学习项目，探索GRPO算法的应用，仅用单个H100 GPU400步训练提升模型性能，完全自研且提供多脚本结构。

2025年2月13日16时作者智东西

春节期间，DeepSeek一跃成为全球科技界的顶流，从媒体头条到巨头财报都有其身影。AI界声量最大的

2024年11月24日13时作者新智元

新智元报道
编辑：桃子 LRS
【新智元导读】
AI自主研发会真的「失控」了吗？最新研究显示，Cla