微软医疗论文泄密:GPT-4o 200B 「大未必强」,Claude 175B 「小未必弱」
微软在最新发布的医疗 AI 评测论文中披露了多个头部 AI 模型的关键参数数据,引发关注。包括 MEDEC 在内的研究团队开发的 MEDEC 评测基准用于检验 AI 模型识别和纠正医疗文档错误的能力,列出了一系列令人瞠目的数据,引发了对 AI 领域技术路线、大模型架构与实际应用效果等议题的讨论。
微软在最新发布的医疗 AI 评测论文中披露了多个头部 AI 模型的关键参数数据,引发关注。包括 MEDEC 在内的研究团队开发的 MEDEC 评测基准用于检验 AI 模型识别和纠正医疗文档错误的能力,列出了一系列令人瞠目的数据,引发了对 AI 领域技术路线、大模型架构与实际应用效果等议题的讨论。
木易介绍了自己的公众号“AI信息Gap”,专注于分享AI知识,并介绍了国产AI公司DeepSeek的技术和产品。DeepSeek发布了一系列模型,包括V3,并且在性能上表现出色,如参数量大、训练高效等。同时提供了多种使用方式。
阶跃星辰自研万亿参数语言大模型Step-2位列全球第五,成绩逼近OpenAI。其表现突出的IF Average指标超越了包括GPT-4在内的所有国内外模型。