DeepSeek再次升级!R1-0528:站上世界第二,智力全面超越xAI与Meta!

DeepSeek最新模型R1-0528在AAII评估中从60分跃升至68分,与谷歌Gemini 2.5 Pro并列全球第二。R1-0528未更换架构但实现了跨学科理解力和推理能力的提升,在所有开源模型中遥遥领先。其表现超越了xAI、Meta及Anthropic等知名模型,并展示了高效的后训练策略,尤其在强化学习的应用上表现出色。

速递|《指环王》级文本吞吐,谷歌发布Gemini2.5 Pro的能效比突破密码

谷歌发布下一代AI推理模型Gemini 2.5,具备多模态能力,并在多个基准测试中表现优异。该模型通过Google AI Studio提供给开发者,并计划在未来几周公布其API定价。

OpenAI 和 Grok 都在卷的 「深度检索」,Perplexity 推出了免费版,实测怎么样

Perplexity 推出新功能 Deep Research,对标 OpenAI 的深度检索、专业输出模式,在 Humanity’s Last Exam 测试中准确率高达21.1%。Deep Research 新增问题难度和多模态理解能力测试,并指出与其他模型相比在准确性及组织资料方面仍有提升空间。