新型轻量级音频模型问世!1.5B参数挑战 Whisper 与 Qwen2-Audio!
一款名为Aero-1-Audio的新型音频模型发布,参数仅有1.5B但性能出色,支持长音频处理、语音识别和音频理解任务。训练时间短且资源占用低,适用于语音助手、实时转写等场景。
一款名为Aero-1-Audio的新型音频模型发布,参数仅有1.5B但性能出色,支持长音频处理、语音识别和音频理解任务。训练时间短且资源占用低,适用于语音助手、实时转写等场景。
埃隆·马斯克旗下xAI公司发布Grok 3大模型,性能超越GPT-4。该模型依托20万块H100 GPU数据中心构建,具备DeepSearch信息检索功能、太空轨道计算系统及AI自主开发游戏等能力,引发市场轰动。
从零实现DeepSeek R1的强化学习项目,探索GRPO算法的应用,仅用单个H100 GPU400步训练提升模型性能,完全自研且提供多脚本结构。