刚刚，o1 在Mensa智商测试中狂砍133分，超98% 人类！

OpenAI的o1模型在Mensa智商测试中拿下了133分。

有人可能会说：「这分数也不高啊？」

别急，让我们来看看这个分数意味着什么。

根据TrackingAI的最新测试数据，o1在Mensa挪威智商测试中表现出色。这个133的分数让它稳稳地站在了人类智商分布的前2%位置。

看看这份实打实的成绩单：

在TrackingAI的测试中，o1完成了35道题目，正确率高达83%。

这是什么概念？

简单来说，o1在做这些题目时的表现，比98%的人类考生都要强！

而且，这可不是那种普通的智商测试。

Mensa测试一直以来都以其严格的标准和专业性闻名，能在这种测试中拿到高分，绝对不是靠运气。

OpenAI内部的研究主管Boris Power也对此发表了看法：「令人惊讶的是，智商测试在衡量AI之间的差异时，仍然展现出了显著的意义。」

在TrackingAI的网站上，我们可以看到这些测试是每周进行11次语言测试和7次视觉测试，以确保数据的准确性和时效性。截至2024年12月13日的最新数据显示，o1的表现持续稳定。

这个成绩单背后还有一个有趣的现象：

AI在标准化测试中的表现，某种程度上反映了它们在实际应用中的能力差异。

所以，下次有人问你「o1到底有多聪明」，

你就可以这样回答：「它比98%的人类都聪明！」

全世界只有大约 2% 的人智商高于 130（图表是德语的），结论应该不言自明：

——人类的平均智商在 85 到 115 之间。top 98% 的人类智商高达 130。

而 o1 完整版的智商为 133，那或许 AGI 已经来了？

不过话说回来，智商测试终究只是衡量AI能力的一个维度。

真正的智能，可能远比一个分数要复杂得多。

（文：AGI Hunt）