AI春晚主角,去年是OpenAI Sora,今年 Qwen 连发三弹,与同城 DeepSeek 联袂接棒
划重点:
❶
中国AI团队强势崛起
!
Qwen2.5系列
实现
多模态理解
、
百万字长文本处理
划重点:
❶
中国AI团队强势崛起
!
Qwen2.5系列
实现
多模态理解
、
百万字长文本处理
Qwen2.5-VL系列模型已开源,包含3B、7B和72B三个尺寸,支持更长视频理解与实时视频交互能力,表格解析效果显著;数学能力及信息抽取计算功能优秀,社区致力于促进机器学习与自然语言处理学术界、产业界和爱好者之间的交流。
DeepSeek发布新模型Janus-Pro-7B,击败DALL-E 3和Stable Diffusion,在GenEval和DPG-Bench基准测试中表现优异。该模型基于自回归框架设计,采用SigLIP-L视觉编码器进行多模态理解和生成。
阿里巴巴发布新视觉多模态模型Qwen2.5-VL,支持AI Agent功能并能自动化操作电脑、手机。Qwen2.5-VL具备强大的图像识别能力及超长视频理解能力,已在Hugging Face和GitHub开源,并提供在线体验。