阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑

阿里开源的通义万相Wan2.1-VACE模型展示了强大的视频生成与编辑功能,包括基础的文生视频、图生视频和视频生视频等初级玩法;加入编辑功能如局部抹除或替换、视频重绘、时长或背景延展等中阶玩法;高阶玩法则能将各种能力花式组合。

大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%

BrowseComp-ZH团队发布新基准测试集,对20多个主流大模型进行中文网页能力测试,结果显示多数模型在中文互联网检索上准确率低于10%,仅有少数能突破20%。研究揭示了模型在中文信息环境中的“死角”,强调了推理能力和多轮策略的重要性,并指出搜索功能的不当使用可能误导模型。

最新!Qwen 3 GPQA跑分接近DeepSeek R1:仅用三分之一参数

大模型独立分析公司Artificial Analysis对Qwen3进行了最新评估,结果显示其表现优异。特别是235B-A22B版本的Qwen3模型,在开启推理模式下达到了70%的GPQA Diamond得分,接近DeepSeek R1和Gemini 2.5 Flash的表现,相比阿里此前最好的Qwen1.5-32B模型有显著提升。