
新智元报道
新智元报道
【新智元导读】在知名AI排行榜LM Arena中,曾全班垫底的GPT-4.5竟一度拿下第一?甚至在数学、编程等领域表现优异,这反常的表现让网友们一度质疑:大模型竞技场莫非被LLM操纵了?不过网友们在实测后却惊讶发现,GPT-4.5的确情商爆表,不用推理就能理解人类的深层意图!

在多轮对话、困难提示、编码、数学、创意写作、指令遵循、长查询等领域都是第一!





GPT-4.5智商结果公布:得分94排名第五



网友实测惊喜:它很理解用户意图!






GPT-4.5并非文武双全

· 风格控制排名:考虑了响应长度和Markdown使用等影响因素的模型排名,从而将模型性能与潜在的混淆因素分离。



GPT-4.5新王登基?测试让人大跌眼镜




为什么现在发布GPT-4.5?

(文:新智元)