DeepSeek再次升级!R1-0528:站上世界第二,智力全面超越xAI与Meta!
DeepSeek最新模型R1-0528在AAII评估中从60分跃升至68分,与谷歌Gemini 2.5 Pro并列全球第二。R1-0528未更换架构但实现了跨学科理解力和推理能力的提升,在所有开源模型中遥遥领先。其表现超越了xAI、Meta及Anthropic等知名模型,并展示了高效的后训练策略,尤其在强化学习的应用上表现出色。
DeepSeek最新模型R1-0528在AAII评估中从60分跃升至68分,与谷歌Gemini 2.5 Pro并列全球第二。R1-0528未更换架构但实现了跨学科理解力和推理能力的提升,在所有开源模型中遥遥领先。其表现超越了xAI、Meta及Anthropic等知名模型,并展示了高效的后训练策略,尤其在强化学习的应用上表现出色。
谷歌发布的Gemini 2.5 Pro模型在多个基准测试中达到SOTA水平,并且在Arena排行榜上排名第一。它具有强大的推理能力和代码生成能力,在视觉和编程领域表现卓越。