Gemini 2.5 Pro深夜重磅更新,再次登顶AI竞技场!

Google DeepMind发布的Gemini-2.5-Pro在LMArena中全面领先,性能第一、价格最低。它在文本、视觉、Web开发三大核心赛道上均排名第一,在多个细分类别也表现优异。同时,其价格为输入每百万token仅1.25美元,输出10美元,远低于其他竞争对手。

Claude4三项实测,他们抢了OpenAI做AI编程的梦,还把路堵上了

Claude Pro上线后,Anthropic公司发布了新版本Claude 4、Claude Code和Claude API。Claude 4引入了混合模型,性能提升且支持本地文件使用,同时API价格与前版相同。Claude Code基于OpenAI Codex设计,具有代码执行功能,并在GitHub上运行。Claude API则提高了提示语缓存时间及引入了新的功能以优化用户体验。

最强开源模型!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用

阿里巴巴发布Qwen3系列模型,包括两个专家混合(MoE)模型和六个Dense模型,并开源了部分权重。该系列在多个基准测试中表现出与OpenAI等顶级模型相当的性能。Qwen3还具有高效的“思考模式”,支持119种语言且训练数据量是Qwen2.5的两倍,有助于Agent调用。部署成本显著降低,整体推理成本也有所节省。