迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单 上午11时 2025/03/17 作者 量子位 小米大模型团队通过微调阿里Qwen2-Audio-7B模型,结合DeepSeek-R1的GRPO算法,在MMAU评测集上实现了64.5%的准确率,显著提升31%,接近人类专家水平。