GPQA 归档 - 每时AI

R2没来，却等来综合性能更优的DeepSeek R1T2

2025年7月7日19时作者 PaperAgent

最近R1变体模型DeepSeek-TNG-R1T2-Chimera冲上热门排行榜Top9，比常规的R1快约20%，在多个基准测试中表现更智能，且与第一代相比更一致，总体表现良好，适合大部分需求。

2025年6月12日8时作者 NLP工程化

Mistral发布Magistral-Small-2506小模型，与Qwen3-4B类似大小且推理能力强，适合单卡32G运行，分数略高于Qwen3-4B。

2025年1月28日14时作者小兵的AI视界

在信息爆炸的时代，高效准确地获取所需信息成为了人们面临的一大挑战。传统的搜索引擎虽然在一定程度上满足

2025年1月21日16时作者新智元

新智元报道
编辑：泽正英智
【新智元导读】
人大清华团队提出Search-o1框架，大幅提升推理模

2024年11月28日18时作者量子位

通义千问团队发布推理模型QwQ，参数量32B，在GPQA等数据集上击败o1-mini，并开源。但其回答较长且冗余，后续需改进简洁度。