阿里巴巴推出可在手机上处理视频音频的AI模型
阿里巴巴发布Qwen2.5-Omni-7B多模态AI模型,支持文本、图像、音频和视频等多种数据形式,并在手机和平板等终端设备上高效运行,推动AI技术普及。
阿里巴巴发布Qwen2.5-Omni-7B多模态AI模型,支持文本、图像、音频和视频等多种数据形式,并在手机和平板等终端设备上高效运行,推动AI技术普及。
通义千问发布Qwen2.5-Omni-7B全模态大模型,支持文本、图像、音频和视频等多种输入形式,提出Thinker-Talker架构及TMRoPE位置编码技术。在多模态任务中表现出色,支持实时交互与语音指令跟随。