DeepSeek再次升级!R1-0528:站上世界第二,智力全面超越xAI与Meta!
DeepSeek最新模型R1-0528在AAII评估中从60分跃升至68分,与谷歌Gemini 2.5 Pro并列全球第二。R1-0528未更换架构但实现了跨学科理解力和推理能力的提升,在所有开源模型中遥遥领先。其表现超越了xAI、Meta及Anthropic等知名模型,并展示了高效的后训练策略,尤其在强化学习的应用上表现出色。
DeepSeek最新模型R1-0528在AAII评估中从60分跃升至68分,与谷歌Gemini 2.5 Pro并列全球第二。R1-0528未更换架构但实现了跨学科理解力和推理能力的提升,在所有开源模型中遥遥领先。其表现超越了xAI、Meta及Anthropic等知名模型,并展示了高效的后训练策略,尤其在强化学习的应用上表现出色。
Google发布全新大模型Gemini 2.5 Pro,支持100万个token上下文窗口,在编程、数学等领域全面领先。Gemini 2.5 Pro在各大基准测试中均实现第一,并且具备强大的逻辑推理和编程能力。
谷歌发布下一代AI推理模型Gemini 2.5,具备多模态能力,并在多个基准测试中表现优异。该模型通过Google AI Studio提供给开发者,并计划在未来几周公布其API定价。
谷歌发布的新一代Gemini 2.5 Pro在多项基准测试中超越OpenAI模型,尤其是在编程、数学和科学领域表现出色,并支持100万tokens上下文窗口。
Perplexity 推出新功能 Deep Research,对标 OpenAI 的深度检索、专业输出模式,在 Humanity’s Last Exam 测试中准确率高达21.1%。Deep Research 新增问题难度和多模态理解能力测试,并指出与其他模型相比在准确性及组织资料方面仍有提升空间。