Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
谷歌发布Gemini 2.5 Pro升级版模型,优化后在多个竞技场中表现领先。新版本加入’思考预算’功能以控制成本和延迟。此外,谷歌即将推出更强的新型号Kingfall。
谷歌发布Gemini 2.5 Pro升级版模型,优化后在多个竞技场中表现领先。新版本加入’思考预算’功能以控制成本和延迟。此外,谷歌即将推出更强的新型号Kingfall。
谷歌最新旗舰模型 Gemini 2.5 Pro 在多项关键基准测试中全面领先,拥有100万 Token 的上下文窗口和稀疏混合专家架构。然而,在开发者社区的反馈中,Gemini 被批评代码风格冗长且容易忘记上下文,而Claude Opus 4 则被认为更具优雅和简洁性。
OpenAI发布新升级功能支持企业用户通过连接器访问更多内部资源并利用实时上下文信息。这些功能包括ChatGPT接入GitHub、Outlook等平台,以及推出MCP协议和记录模式会议转录服务。
谷歌发布开源项目Gemini-fullstack-langgraph-quickstart,结合Gemini 2.5模型与LangGraph框架,展示快速构建研究型AI代理系统的方法。项目分为五步智能查询生成、网络信息搜集、反思与知识缺口分析、迭代优化搜索和综合答案生成,强调组合式AI架构、可解释性设计和实时信息整合。
DeepSeek R1-0528版本超越xAI、Meta等成为全球第二大人工智能实验室,并与谷歌并列。其智能指数得分从60分跃升至68分,超过多个顶级模型,提升主要体现在数学竞赛、代码生成和推理方面。
Meta决定重组AI团队以应对人才流失、竞争对手压力和技术停滞等问题,旧研发体系被拆分为AI产品团队、AGI基础团队和AI研究部门,Yann LeCun领导的FAIR团队仍保持独立。Llama系列面临翻车及跳票问题,外部人才持续流出影响Meta的研发节奏。
上周谷歌在开发者大会展示了其新作Veo3。为了探索更多创意和科技,作者访问了Google Labs网站,发现这里藏匿着各种AI工具,如能让世界名画「唱歌」的National Gallery Mixtape等。该工具结合伦敦国家美术馆精选的世界名画进行音乐实验。
谷歌通过AI Overviews和AI Mode大幅削弱用户点击网站的需求,导致搜索结果从信息入口变为信息终点。这引发了谷歌自身商业模式的危机,并预示着传统搜索引擎可能走向终结。