MiniCPM-o 2.6:视觉、语音和多模态流式能力达到了GPT-4o级别 下午2时 2025/01/15 作者 PaperAgent MiniCPM-o 2.6 是性能最佳的多模态大模型之一,支持视觉、语音和多模态流式能力达到GPT-4级别,并新增了可配置声音功能及情感/语速/风格控制等新特性。