阿里Qwen家族又添猛将!Qwen2.5-Omni能看能听能说能写,性能超越Gemini,视频实时互动。

阿里 Qwen 新增模型Qwen2.5-Omni支持文本、图片、音频和视频处理,具备实时响应能力。其自研的’Thinker-Talker’双核架构确保了强大的多模态理解与生成能力,并已在GitHub等平台上开源。