速递｜Meta豪赌AI，即将发布全能模型Llama 4

图片来源：Unsplash

马克·扎克伯格今年正在提升 Meta 人工智能的语音功能，准备从这项快速发展技术中创收。

Meta 计划在其最新的开源大型语言模型 Llama 4 中引入改进的语音功能，预计将在未来几周内发布，据知情人士透露。该公司押注未来的所谓 AI Agent将是对话式而非文本主导的。

该公司特别致力于使用户与其语音模型之间的对话更接近双向自然对话，允许用户打断，而不是采用更僵化的问答形式。

语音功能的推出正值CEO扎克伯格概述了雄心勃勃的计划，旨在使这家市值 1.7 万亿美元的硅谷公司成为“AI 领导者”，并将 2025 年称为其许多 AI 产品的成败之年，因为该集团正与 OpenAI、微软和谷歌等竞争对手竞相将这项技术商业化。

这促使公司考虑为其 AI 助手 Meta AI 试行高级订阅服务，用于预订和视频创作等代理任务，两位知情人士表示。

其中一位人士还提到，公司也考虑在 AI 助手的搜索结果中引入付费广告或赞助帖子。

扎克伯格今年透露了，构建具备中级工程师编码和解决问题能力的 AI 工程助手的计划，他表示这一计划潜在拥有“非常庞大的市场”。

该集团首席产品官 Chris Cox 周三重点介绍了 Llama 4 的一些计划，称其将成为一个“全能模型”，语音将“原生支持对话，而不是将语音转换为文本，发送文本到LLM，获取文本输出，再将其转换回语音”。

在摩根士丹利技术、媒体与电信会议上，他补充道：“我认为这对界面产品来说是一个巨大的突破，即你可以与互联网对话并询问任何问题。我觉得我们仍在努力理解这一功能的强大之处。”

Meta 也在讨论最新 Llama 模型应具备的输出限制以及是否降低这些限制，两位知情人士透露。

讨论之际，竞争对手纷纷推出新产品，新任“AI 沙皇”、硅谷风险投资家 David Sacks 也发出警告，他表示希望确保美国 AI 模型不会带有政治偏见或“觉醒”色彩。

OpenAI 去年发布了其语音模式，并致力于赋予其独特的个性，而由 Elon Musk 的 xAI 创建并在 X 平台上可用的 Grok 3，于上个月末向部分用户推出了其语音功能。

Grok 模型专门设计为具有较少的限制措施，包括一种“无拘束模式”，该模式故意以“令人反感、不恰当和冒犯”的方式回应，该公司表示。

Meta 去年发布了第三版 Llama 的 AI 模型，该版本不再那么“道貌岸然”，此前 Llama 2 因拒绝回答无辜问题而受到批评。

允许用户通过语音命令与 AI 助手互动，是 Meta 的 Ray-Ban 智能眼镜的一大特色，这款眼镜最近在消费者中大受欢迎。

该集团已加快其打造轻量级头戴设备的计划，旨在取代智能手机成为消费者的主要计算设备。

本文翻译自：FT

https://www.ft.com/content/a1014427-c2ce-4204-b41a-001277309cea

编译：ChatGPT

——-

（文：Z Potentials）