拜拜,昂贵的谷歌搜索 API!阿里开源 RL 框架让大模型自给自足、成本直降88%,网友:游戏规则变了
阿里巴巴发布ZeroSearch技术,通过强化学习允许大语言模型开发高级搜索功能,无需真实搜索引擎交互,显著降低API成本至几乎为零。
阿里巴巴发布ZeroSearch技术,通过强化学习允许大语言模型开发高级搜索功能,无需真实搜索引擎交互,显著降低API成本至几乎为零。
阿里通义实验室高层薄列峰离职,加入某互联网大厂担任多模态模型部副总经理。此前,通义实验室已有两位核心负责人鄢志杰和黄非离职。薄列峰曾带领团队开发了通义App上的爆款功能。
Aitrainee介绍并评测了阿里巴巴发布的Qwen3模型系列,包括多种参数规模的MoE和Dense模型,并展示了其在性能、多语言支持和推理预算方面的优势。
阿里巴巴发布Qwen3系列模型,包括两个专家混合(MoE)模型和六个Dense模型,并开源了部分权重。该系列在多个基准测试中表现出与OpenAI等顶级模型相当的性能。Qwen3还具有高效的“思考模式”,支持119种语言且训练数据量是Qwen2.5的两倍,有助于Agent调用。部署成本显著降低,整体推理成本也有所节省。
今日头条:阿里巴巴发布Qwen3系列模型;OpenAI在ChatGPT中增加购物功能。新品动态:腾讯混元3D二代、Character.AI AvatarFX登场;DeepSeek将发布新一代模型。研究发现:GPT-4o可能存在“讨好型”回应;Pony.ai自动驾驶系统成本大降70%。行业观察:微软暂停数据中心建设计划,IBM未来五年计划投资1500亿美元研发。
阿里巴巴开源新一代通义千问Qwen3系列模型,包含8款不同尺寸。旗舰模型Qwen3 235B采用混合专家(MoE)架构,在多项测评中超越DeepSeek-R1、OpenAI-o1等主流模型。性能提升体现在推理、指令遵循、工具调用、多语言能力等方面。Qwen3全尺寸发布后,社区反响热烈,参数正在“变小”但保持出色表现。
阿里开源最新大模型Qwen3,在多个测试平台上超越知名模型。Qwen3支持多种语言和方言,覆盖119种语言,包含2个MoE模型权重及6个Dense模型。其预训练数据集庞大,涵盖36万亿token,性能与Qwen2.5相当甚至超过。
阿里在2025年中国商用大模型厂商评估中连续两年被评为领导者,并在模型能力和执行能力两大核心维度上排名第一。Omdia报告显示,阿里不仅在技术层面领先,还因其生态建设和商业化优势实现全面领先。
阿里巴巴发布FantasyTalking,能够实现角色口型同步,并具备逼真的面部和全身动作,表现优于现有SOTA方法。