日期: 2025 年 6 月 13 日
【博客转载】CUDA Kernel Execution Overlap
CUDA kernel执行重叠可以通过调整blocks_per_grid的值来实现。通过使用不同的blocks_per_grid值,可以观察到不同kernel执行之间的重叠效果。隐式同步可能导致默认流中的CUDA命令间的同步问题,并可通过启用per-thread default Stream来解决。
在线教程丨刷新TTS模型SOTA,OpenAudio S1基于200万小时音频数据训练,深刻理解情感及语音细节
HyperAI超神经官网推出OpenAudio-s1-mini教程,介绍高效文本转语音生成工具。OpenAudio S1包含OpenAudio-S1和OpenAudio-S1-mini版本,在大规模音频数据上训练,参数扩展至40亿,并引入奖励建模及RLHF训练机制,显著提升音频质量、情感表达和说话人相似度。该模型仅需每百万字节15美元(约0.8美元/小时),支持多种情感、语调和特殊标记。HyperAI超神经提供免费RTX 4090资源体验OpenAudio-s1-mini功能。
超越英伟达B200!AMD最强AI芯:1.6倍大内存、大模型推理快30%,奥特曼都来站台
AMD发布MI350X和MI355X两款GPU,采用3nm工艺,包含1850亿晶体管。算力提升4倍,推理速度提高35倍,内存是英伟达B200的1.6倍。搭配ROCm 7软件栈,FP8算力达到1.3EFLOPs,支持超过180万个Hugging Face模型。MI400系列将于明年推出,预计比MI300系列快10倍。
硅基流动完成新一轮数亿元融资,打造开发者首选生成式 AI 开发平台
硅基流动完成数亿元人民币 A 轮融资,阿里云领投。公司推出高性能推理引擎和一站式异构算力纳管平台,助力大模型开发与应用。袁进辉将在 AICon 大会上分享 AI-Native Cloud 的探索与展望。
视频扩散模型新突破!清华腾讯联合实现高保真3D生成,告别多视图依赖
清华大学联合腾讯提出 Scene Splatter,利用视频扩散模型从一张图像生成满足三维一致性的多视角视频片段,解决单张图片条件下三维重建的病态问题。