TMRoPE位置编码归档

阿里巴巴推出可在手机上处理视频音频的AI模型

2025年3月28日19时作者 AI音频时代

阿里巴巴发布Qwen2.5-Omni-7B多模态AI模型，支持文本、图像、音频和视频等多种数据形式，并在手机和平板等终端设备上高效运行，推动AI技术普及。

2025年3月27日16时作者 Founder Park

通义千问发布Qwen2.5-Omni-7B全模态大模型，支持文本、图像、音频和视频等多种输入形式，提出Thinker-Talker架构及TMRoPE位置编码技术。在多模态任务中表现出色，支持实时交互与语音指令跟随。