多项选择题归档 - 每时AI

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

下午4时 2025/04/04 作者机器之心

把复杂问题交给大模型。它们通常会陷入「深度思考」，有条不紊地展示思维链过程，并最终输出一份近乎完美的

中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集，仅三个大模型达及格线

下午6时 2024/12/26 作者机器之心

机器之心发布
机器之心编辑部
在当今迅速发展的人工智能时代，大语言模型（LLMs）在各种应用中发挥着