刚刚,o1 在Mensa智商测试中狂砍133分,超98% 人类​!

OpenAI的o1模型在Mensa智商测试中拿下了133分。

有人可能会说:「这分数也不高啊?」

别急,让我们来看看这个分数意味着什么。

根据TrackingAI的最新测试数据,o1在Mensa挪威智商测试中表现出色。这个133的分数让它稳稳地站在了人类智商分布的前2%位置

看看这份实打实的成绩单:

在TrackingAI的测试中,o1完成了35道题目,正确率高达83%。

这是什么概念?

简单来说,o1在做这些题目时的表现,比98%的人类考生都要强

而且,这可不是那种普通的智商测试。

Mensa测试一直以来都以其严格的标准和专业性闻名,能在这种测试中拿到高分,绝对不是靠运气。

OpenAI内部的研究主管Boris Power也对此发表了看法:「令人惊讶的是,智商测试在衡量AI之间的差异时,仍然展现出了显著的意义。」

在TrackingAI的网站上,我们可以看到这些测试是每周进行11次语言测试和7次视觉测试,以确保数据的准确性和时效性。截至2024年12月13日的最新数据显示,o1的表现持续稳定。

这个成绩单背后还有一个有趣的现象:

AI在标准化测试中的表现,某种程度上反映了它们在实际应用中的能力差异

所以,下次有人问你「o1到底有多聪明」,

你就可以这样回答:「它比98%的人类都聪明!」

全世界只有大约 2% 的人智商高于 130(图表是德语的),结论应该不言自明:

——人类的平均智商在 85 到 115 之间。top 98% 的人类智商高达 130。

而 o1 完整版的智商为 133,那或许 AGI 已经来了?

不过话说回来,智商测试终究只是衡量AI能力的一个维度。

真正的智能,可能远比一个分数要复杂得多。

(文:AGI Hunt)

欢迎分享

发表评论