刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信
刚泄露的Grok 4和Grok 4 Code基准测试结果显示其在Humanities Last Exam(HLE)上达到惊人的45%,远超OpenAI o3及Claude Opus 4。此外,在研究生级物理和天文学问题上得分高达87-88%。
刚泄露的Grok 4和Grok 4 Code基准测试结果显示其在Humanities Last Exam(HLE)上达到惊人的45%,远超OpenAI o3及Claude Opus 4。此外,在研究生级物理和天文学问题上得分高达87-88%。
Grok-4的基准测试数据在网上疯传,HLE成绩达到35%,使用推理后更是飙升到45%,相当于直接翻了一倍多,引发热议。