最强开源模型!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用

阿里巴巴发布Qwen3系列模型,包括两个专家混合(MoE)模型和六个Dense模型,并开源了部分权重。该系列在多个基准测试中表现出与OpenAI等顶级模型相当的性能。Qwen3还具有高效的“思考模式”,支持119种语言且训练数据量是Qwen2.5的两倍,有助于Agent调用。部署成本显著降低,整体推理成本也有所节省。

AI每日速报 | 2025-04-29

今日头条:阿里巴巴发布Qwen3系列模型;OpenAI在ChatGPT中增加购物功能。新品动态:腾讯混元3D二代、Character.AI AvatarFX登场;DeepSeek将发布新一代模型。研究发现:GPT-4o可能存在“讨好型”回应;Pony.ai自动驾驶系统成本大降70%。行业观察:微软暂停数据中心建设计划,IBM未来五年计划投资1500亿美元研发。

终于,它来了!Qwen3深夜发布,再次登顶全球大模型开源王座,再见DeepSeek。

Qwen3今日发布,参数量2350亿的旗舰模型Qwen3-235B-A22B超越多个模型。亮点包括混合思维模式、多语言支持和增强代理能力;预训练数据集涵盖119种语言,计算成本更低;链接见原文。

Qwen3发布!超DeepSeek R1登顶开源榜,还带来了跟R1不同配方

阿里巴巴开源新一代通义千问Qwen3系列模型,包含8款不同尺寸。旗舰模型Qwen3 235B采用混合专家(MoE)架构,在多项测评中超越DeepSeek-R1、OpenAI-o1等主流模型。性能提升体现在推理、指令遵循、工具调用、多语言能力等方面。Qwen3全尺寸发布后,社区反响热烈,参数正在“变小”但保持出色表现。