速递｜Meta对内部超越OpenAI的GPT-4充满执念

图片来源：Meta

根据周二法院解封的内部消息，负责 Meta 人工智能工作的高管和研究人员在开发 Llama 3 时，专注于超越 OpenAI 的 GPT-4 模型，这与公司正在进行的人工智能版权案件 Kadrey 诉 Meta 有关。

“老实说……我们的目标需要是 GPT-4，”Meta 的生成 AI 副总裁 Ahmad Al-Dahle 在 2023 年 10 月给 Meta 研究员 Hugo Touvron 的消息中说道。“我们有 64,000 个 GPU 要来了！我们需要学习如何建立前沿并赢得这场比赛。”

尽管 Meta 发布了开放的 AI 模型，但该公司的 AI 领导者更专注于击败那些通常不发布其模型权重的竞争对手，如 Anthropic 和 OpenAI，而是将其封锁在 API 后面。Meta 的高管和研究人员将 Anthropic 的 Claude 和 OpenAI 的 GPT-4 视为努力的黄金标准。

法国人工智能初创公司 Mistral 是 Meta 最大的开源竞争对手之一，在内部消息中被提及了几次，但语气却是轻蔑的。

“Mistral 对我们来说微不足道，” Al-Dahle 在一条消息中说。“我们应该能够做得更好，”他后来表示。

科技公司如今正竞相推出尖端的人工智能模型，但这些法庭文件揭示了 Meta 的人工智能领导者们究竟有多么竞争激烈——而且似乎仍然如此。在多次信息交流中，Meta 的人工智能负责人谈到他们在获取训练 Llama 所需的正确数据方面是“非常积极的”；在某个时刻，一位高管甚至在给同事的消息中表示“Llama 3 是我唯一关心的事情”。

本案的检察官指控 Meta 的高管在急于发布 AI 模型的过程中，偶尔采取了捷径，使用了受版权保护的书籍进行训练。

Touvron 在一条消息中指出，用于 Llama 2 的数据集混合“很糟糕”，并谈到 Meta 可以使用更好的数据源混合来改进 Llama 3。Touvron 和 Al-Dahle 随后讨论了清理路径以使用 LibGen 数据集，该数据集包含 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 的版权作品。

“我们里面有正确的数据集吗[?]” Al-Dahle 说。“有没有什么你想用但因为某些愚蠢的原因不能用的？”

Meta 首席执行官马克·扎克伯格之前表示，他正在努力缩小 Llama 的 AI 模型与 OpenAI、谷歌等公司的闭源模型之间的性能差距。内部消息揭示了公司内部为此所承受的巨大压力。

“今年，Llama 3 在最先进的模型中具有竞争力，并在某些领域处于领先地位，”扎克伯格在 2024 年 7 月的一封信件中说道。“从明年开始，我们预计未来的 Llama 模型将成为行业中最先进的。”

当 Meta 最终在 2024 年 4 月发布 Llama 3时，这款开放的 AI 模型与来自 Google、OpenAI 和 Anthropic 的领先封闭模型具有竞争力，并且在性能上超过了 Mistral 的开源选项。然而，Meta 用于训练其模型的数据——据报道，扎克伯格已批准使用这些数据，尽管其版权状态存在争议——正面临几起正在进行的诉讼的审查。

本文翻译自：TechCrunch, https://techcrunch.com/2025/01/14/meta-execs-obsessed-over-beating-openais-gpt-4-internally-court-filings-reveal/

编译：ChatGPT

——-

（文：Z Potentials）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复