速递|Meta对内部超越OpenAI的GPT-4充满执念

图片来源:Meta

根据周二法院解封的内部消息,负责 Meta 人工智能工作的高管和研究人员在开发 Llama 3 时,专注于超越 OpenAI 的 GPT-4 模型,这与公司正在进行的人工智能版权案件 Kadrey 诉 Meta 有关。

“老实说……我们的目标需要是 GPT-4,”Meta 的生成 AI 副总裁 Ahmad Al-Dahle 在 2023 年 10 月给 Meta 研究员 Hugo Touvron 的消息中说道。“我们有 64,000 个 GPU 要来了!我们需要学习如何建立前沿并赢得这场比赛。”

尽管 Meta 发布了开放的 AI 模型,但该公司的 AI 领导者更专注于击败那些通常不发布其模型权重的竞争对手,如 Anthropic 和 OpenAI,而是将其封锁在 API 后面。Meta 的高管和研究人员将 Anthropic 的 Claude 和 OpenAI 的 GPT-4 视为努力的黄金标准。

法国人工智能初创公司 Mistral 是 Meta 最大的开源竞争对手之一,在内部消息中被提及了几次,但语气却是轻蔑的。

“Mistral 对我们来说微不足道,” Al-Dahle 在一条消息中说。“我们应该能够做得更好,”他后来表示。

科技公司如今正竞相推出尖端的人工智能模型,但这些法庭文件揭示了 Meta 的人工智能领导者们究竟有多么竞争激烈——而且似乎仍然如此。在多次信息交流中,Meta 的人工智能负责人谈到他们在获取训练 Llama 所需的正确数据方面是“非常积极的”;在某个时刻,一位高管甚至在给同事的消息中表示“Llama 3 是我唯一关心的事情”。

本案的检察官指控 Meta 的高管在急于发布 AI 模型的过程中,偶尔采取了捷径,使用了受版权保护的书籍进行训练。

Touvron 在一条消息中指出,用于 Llama 2 的数据集混合“很糟糕”,并谈到 Meta 可以使用更好的数据源混合来改进 Llama 3。Touvron 和 Al-Dahle 随后讨论了清理路径以使用 LibGen 数据集,该数据集包含 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 的版权作品。

“我们里面有正确的数据集吗[?]” Al-Dahle 说。“有没有什么你想用但因为某些愚蠢的原因不能用的?”

Meta 首席执行官马克·扎克伯格之前表示,他正在努力缩小 Llama 的 AI 模型与 OpenAI、谷歌等公司的闭源模型之间的性能差距。内部消息揭示了公司内部为此所承受的巨大压力。

“今年,Llama 3 在最先进的模型中具有竞争力,并在某些领域处于领先地位,”扎克伯格在 2024 年 7 月的一封 信件中说道。“从明年开始,我们预计未来的 Llama 模型将成为行业中最先进的。”

当 Meta 最终在 2024 年 4 月发布 Llama 3时,这款开放的 AI 模型与来自 Google、OpenAI 和 Anthropic 的领先封闭模型具有竞争力,并且在性能上超过了 Mistral 的开源选项。然而,Meta 用于训练其模型的数据——据报道,扎克伯格已批准使用这些数据,尽管其版权状态存在争议——正面临几起正在进行的诉讼的审查。

本文翻译自:TechCrunch, https://techcrunch.com/2025/01/14/meta-execs-obsessed-over-beating-openais-gpt-4-internally-court-filings-reveal/

编译:ChatGPT

——-

(文:Z Potentials)

欢迎分享

发表评论