AI评测归档 - 每时AI

微软医疗论文泄密：GPT-4o 200B 「大未必强」，Claude 175B 「小未必弱」

下午11时 2025/01/02 作者毫河风报

微软在最新发布的医疗 AI 评测论文中披露了多个头部 AI 模型的关键参数数据，引发关注。包括 MEDEC 在内的研究团队开发的 MEDEC 评测基准用于检验 AI 模型识别和纠正医疗文档错误的能力，列出了一系列令人瞠目的数据，引发了对 AI 领域技术路线、大模型架构与实际应用效果等议题的讨论。