根据周二法院解封的内部消息,负责 Meta 人工智能工作的高管和研究人员在开发 Llama 3 时,专注于超越 OpenAI 的 GPT-4 模型,这与公司正在进行的人工智能版权案件 Kadrey 诉 Meta 有关。
“老实说……我们的目标需要是 GPT-4,”Meta 的生成 AI 副总裁 Ahmad Al-Dahle 在 2023 年 10 月给 Meta 研究员 Hugo Touvron 的消息中说道。“我们有 64,000 个 GPU 要来了!我们需要学习如何建立前沿并赢得这场比赛。”
尽管 Meta 发布了开放的 AI 模型,但该公司的 AI 领导者更专注于击败那些通常不发布其模型权重的竞争对手,如 Anthropic 和 OpenAI,而是将其封锁在 API 后面。Meta 的高管和研究人员将 Anthropic 的 Claude 和 OpenAI 的 GPT-4 视为努力的黄金标准。
法国人工智能初创公司 Mistral 是 Meta 最大的开源竞争对手之一,在内部消息中被提及了几次,但语气却是轻蔑的。
“Mistral 对我们来说微不足道,” Al-Dahle 在一条消息中说。“我们应该能够做得更好,”他后来表示。
科技公司如今正竞相推出尖端的人工智能模型,但这些法庭文件揭示了 Meta 的人工智能领导者们究竟有多么竞争激烈——而且似乎仍然如此。在多次信息交流中,Meta 的人工智能负责人谈到他们在获取训练 Llama 所需的正确数据方面是“非常积极的”;在某个时刻,一位高管甚至在给同事的消息中表示“Llama 3 是我唯一关心的事情”。
本案的检察官指控 Meta 的高管在急于发布 AI 模型的过程中,偶尔采取了捷径,使用了受版权保护的书籍进行训练。
Touvron 在一条消息中指出,用于 Llama 2 的数据集混合“很糟糕”,并谈到 Meta 可以使用更好的数据源混合来改进 Llama 3。Touvron 和 Al-Dahle 随后讨论了清理路径以使用 LibGen 数据集,该数据集包含 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 的版权作品。
“我们里面有正确的数据集吗[?]” Al-Dahle 说。“有没有什么你想用但因为某些愚蠢的原因不能用的?”
Meta 首席执行官马克·扎克伯格之前表示,他正在努力缩小 Llama 的 AI 模型与 OpenAI、谷歌等公司的闭源模型之间的性能差距。内部消息揭示了公司内部为此所承受的巨大压力。
“今年,Llama 3 在最先进的模型中具有竞争力,并在某些领域处于领先地位,”扎克伯格在 2024 年 7 月的一封 信件中说道。“从明年开始,我们预计未来的 Llama 模型将成为行业中最先进的。”
本文翻译自:TechCrunch, https://techcrunch.com/2025/01/14/meta-execs-obsessed-over-beating-openais-gpt-4-internally-court-filings-reveal/
编译:ChatGPT
(文:Z Potentials)