变体题归档 - 每时AI

斯坦福揭秘o1-preview软肋！数学竞赛题稍作修改，准确率骤降30%

下午4时 2025/01/31 作者新智元

斯坦福研究发现，即使在数学竞赛中表现出色的大模型o1-preview，在题目稍作修改后准确率也会大幅下降30%。这揭示了AI模型在应对变体题时的局限性。