
图片来源:a16z
Z Highlights:
-
现在如果我想听音乐,我第一反应是:“我要用哪个服务?Spotify还是Tidal?”但这其实不是我真正的需求。我的真实意图是:“我想听这首歌。”我希望只要说出来,AI就能帮我搞定。
-
更大的问题其实是“接纳风险”(adoption risk)。人们是否真的愿意接受这类技术?是否愿意学习全新的交互方式?我们都经历过打字学习曲线,如今手机操作对我们来说已经成了本能。那么问题来了——人们愿意为了这些新模态再重新学一套东西吗?对他们来说,值不值?
-
这其实是一个经典的“Commoditize your complements”策略(ZP注:商品化互补品,是一种商业策略,意指将与自己产品互补的商品变得廉价或普及,从而增加自身产品的需求)。我们的核心产品会因为AI而变得更好。但就算所有人都能用上同一套开源模型,他们也没法做出我们的产品。这种结构性的非对称对我们是有利的。
-
过去我一直认为生态缺口是最大的风险,但现在AI可能反而是那个“银弹”。如果未来AI本身就是主界面,它就跟设备天然绑定,不再需要依赖传统App来构建生态。
-
你得下定决心,停下手头其他事,把时间、资源、人力都投入进去,才能真的把未来造出来。我们现在就在做这件事。
Andrew Bosworth是Meta的首席技术官,主管Reality Labs团队。David George是a16z的普通合伙人,负责领导公司的Growth投资团队。本文系Andrew Bosworth与David George在a16z Growth团队的访谈栏目AI Revolution中的访谈实录。
内容消费的未来
David George:我们直接切入正题吧——五年后、十年后,我们会以什么样的方式来消费内容?
Andrew Bosworth:说十年,我反倒更有把握。到那时候,我们接收内容的方式绝不会只是掏出手机。AR 眼镜有很大机会成为主流入口。而且我希望在沉浸式体验这块,我们能有更好的解决方案。
现在如果你想要沉浸感,比如去Sphere那种场馆——很棒,但全世界只有一个,还在拉斯维加斯,得专门安排一趟行程去体验。
有没有更轻量、随时可达的方式?比如我想跟我爸一起看比赛,而且真的有坐在场边的感觉。我们当然可以买票去现场,但有没有替代方案?我觉得是有的。换句话说,我对未来十年里出现更多“非手机式”的内容入口持乐观态度。
五年这个时间节点会更微妙一些。到时候的智能眼镜、AI眼镜、带显示的眼镜应该会挺不错。有些会是高端款,体验极佳;也会有一些是分辨率一般、但全天候佩戴、始终在线的版本。你可能不会拿它们来干活,但用来快速浏览信息、处理碎片内容,会非常顺手。
我们正面临一个光谱:一端是极致但昂贵的体验,无法普及;另一端是体验不够丰富但始终可用的产品。真正令人兴奋的是——人们能开始接触到以前根本无法实现的那类内容交互方式,而MR和VR正在开启这种可能性。
把技术趋势转化为真正的产品体验
David George:你在把重大技术变迁转化为产品体验方面一直做得非常出色。在Facebook,你参与打造了News Feed,它本质上融合了社交、移动端,以及早期的AI。
Andrew Bosworth:我和Meta的团队之所以能做成一些事,是因为我们真的沉浸在用户的问题里。人们到底在做什么?他们真正想要的是什么?
从这个出发点看问题,你会自然选择手边最合适的技术工具。这能帮你更清晰地判断什么工具有效,也能让你更早看出趋势的本质。如果你一开始就盯着某项技术,容易陷入某个风口,甚至在技术退潮时也不愿承认,反而错过下一个机会。
David George:对,那种时候你就不是在解决产品问题,而是为了技术而做技术。
Andrew Bosworth:完全同意。只有当你真正聚焦在实际问题上——哪怕这些问题不那么“高大上”——你才能做出真正有价值的产品。这也是为什么现在的AI革命让我感觉特别不一样:它解决了真实的痛点,哪怕也带来了新的挑战,但它是一次底层能力的大扩展。
现在的AI确实有问题,比如真实性、算力、成本……但这些问题可解。而更难得的是:它可以适用于非常广的领域。过去的技术突破通常是局部优化:这里快一点,那里便宜一点。但这一次是整体体验都被拉升了。
我现在用到的每一个界面、解决的每一个问题,都在被这波技术刷新。这非常罕见。其实我和Mark早就判断这波技术革命一定会来——只是没想到会来得这么快,我们原本以为还得等十年。
我们当时预期,最先发生变化的应该是界面层的革命。大概从2015年起,手机的形态就已经到顶了。它可能是我们用过最成功的计算平台,但下一步一定要更自然:通过眼睛、耳朵获取信息,通过“意图”来表达,而不是靠键盘和触屏。
所以我们得用上头部,因为需要接入用户的视觉和听觉。还需要某种神经接口,或者其它能让用户表达意图的方式。
这个方向我们已经想了十年了。但现实情况是——我们这代工程师几乎都是在现有范式中长大的,整个系统——包括App模型、交互设计——都是“默认值”。是的,我们从鼠标走向触控,但本质还是“直接操作”(direct manipulation),这个范式从60年代就没有变过。
交互模态没变,而这本身是有代价的。因为我们已经太擅长当前这套工具了。
挑战就变成:我们要造出一种全新的硬件,它不仅得能力强、体验好,还得足够轻、好看、价格可接受——而这一切过去都不存在。可这还只是问题的一半,另一半更难:我该怎么用它?
我用手机已经用得非常熟练了,几乎变成身体和意图的延伸了。你要做的不是取代它,而是让体验变得更轻、更自然。那是一座大山。
就在我们还在攻这座山的时候,AI来了。两年前,它突然就到了,远比我们预期的早。这是个巨大的机会:它可以让我们更轻松地实现“意图驱动交互”。
今天的AI确实还不是完整的交互接口。我还没法完全靠它操控设备。但它已经能理解我的模糊表达,从庞大的信息语料中推理出明确的动作。
离真正可控还有距离,但我们清楚方向在哪里。更重要的是:现在我们不再是单打独斗地爬山,而是背后有了顺风助力。
尤其在交互设计这块,我们终于有可能打造出一种真正理解上下文的智能Agent——它知道你正在看什么、听到什么、身边发生了什么,并据此做出推断和响应。
Reality Labs的演进与“后手机”世界的构想
David George:我们来聊聊Reality Labs和你们在做的产品体系。从Quest头显、智能眼镜,到更远期的Orion(我也体验过),这些产品是怎么一步步演进的?它们分别面向哪些市场?未来会趋同还是分化?
Andrew Bosworth:最开始我们做Ray-Ban Meta项目的时候,目标很清晰——就是一款智能眼镜。那时硬件已经基本定型,离量产只有六个月。然后Llama 3发布了,团队立刻决定:“不行,我们得加上AI。”
于是它变成了AI眼镜。外形本身就是对的,算力、音频系统也都准备好了。我们只是加了一层能
力:你可以直接和眼镜对话。
去年12月,我们通过
早期体验项目推出了“Live AI”功能。你可以启动一次30分钟的实时会话(续航极限),眼镜能“看到”你所看到的内容。
从纸面规格看,Ray-Ban Meta和上一代Ray-Ban Stories差别不大。但我想强调的是——硬件差不多,交互体验却是另一层次。
等你用上Orion,也就是我们完整形态的AR眼镜,你就会真正开始想象“后手机时代”的生活。如果这个设备够轻、续航够久、外观够好——我可以一整天都戴着它。所有我需要的信息和功能都在那里。
再叠加上AI能力,比如你体验过的那个早餐食材的Demo。

图片来源:Orion官网
David George:对,我看着一堆食材,说:“Hey Meta,我能做点什么?”然后它直接给出了菜谱,非常惊艳。
Andrew Bosworth:这就是Orion的方向。最初它其实没集成AI,结构和手机很像:包含打电话、发邮件、信息、游戏、刷Instagram Reels等一套标准App模式。
但我们现在更兴奋的,是把一个理解现实世界的智能助手叠加进来。它不仅理解你点了什么、说了什么,还理解你当下所处的真实环境。它能把“我此刻需要什么”和“我眼前发生了什么”连接起来。
这个思路是反转App模式的:不再是“帮我打开Instagram”,而是“我现在有空,想看看我喜欢的球队最近有什么精彩瞬间”——主动场景驱动,而不是应用驱动。
不过说到底,硬件的难度是真的高。成本也是真的难控。你想挑战手机这个霸主地位,必须准备充分。
手机是我们日常的核心。它控制家、车、工作……所有东西。整个世界已经围绕手机重新建构了——就连我家的冰箱都有配套的手机App。虽然有点荒谬,但它真的存在。
从十年视角看,这些设备一定会走向普及。但从五年视角看,即使我们做得完美,取代手机也几乎是不可能完成的任务。
后手机时代的过渡桥梁
David George:是啊,确实很难想象脱离现有操作系统的生活状态。那么在这个中间阶段呢?假设硬件已经够强、市场也开始接受了,那它要不要和手机绑定?你对“是否要依赖手机”这件事有什么明确立场吗?
Andrew Bosworth:手机的优势太明显了——它已经是我们生活的核心了。而且整个开发者生态都围绕它构建,是个非常理想的锚点设备。
但我们发现:一旦不再用触控来控制,App本身就不该是原来的样子。这不是个新观点。早期移动端有很多失败的尝试——我们自己也踩过坑——当时就是简单地把Web内容往手机上搬。
我们当时的想法是:“那就把网页放到手机上呗。”但问题在于:网页那一套并不原生于手机的交互逻辑。UI布局、信息组织方式、交互节奏都不合适。所以我们失败了,哪怕那款产品在Web上是历史级的爆款。
David George:听起来像是“拟物化设计 vs. 原生设计”的争论。
Andrew Bosworth:对,本质是一样的道理。开发者生态固然重要,功能多也有价值,但一旦你把界面投射到3D空间里、试图用手势操作它而不是触屏,所有交互逻辑都得重写。你不再有精确的点击点,没有原生的语音接口,也没有适配这类场景的设计语言和开发工具。
所以站在硬件层面,手机平台确实是一个稳定的出发点;但在软件层面,它反而成了一种限制。
我们对合作持开放态度。随着硬件的成熟,我们也想看看平台方的态度会如何演变。毕竟,很多用户还是会愿意花1200美元买旗舰手机,他们肯定也希望能无缝接入其他设备。我也希望主流平台能继续支持这类组合式体验。
Andrew Bosworth:我现在最关注的一个问题是:整个App模式会不会被AI彻底颠覆。我们一开始在设想这些新设备时,其实延续的还是很“手机式”的App架构——只是输入方式变了。
但AI可能会彻底翻转这套逻辑。
举个例子,现在如果我想听音乐,我第一反应是:“我要用哪个服务?Spotify还是Tidal?”但这其实不是我真正的需求。我的真实意图是:“我想听这首歌。”我希望只要说出来,AI就能帮我搞定。
它应该知道我已经订阅了哪个服务,或者哪家延迟更低、音质更好;如果这首歌不在我常用的平台上,它也应该能说:“另外一个平台有,要不要试试看?”——整个过程不该是我来选App,而应该由系统理解我想做什么,然后自动匹配服务。
但我们过去几十年用的计算方式,都是先选App,再解决问题,所以才变成今天这个样子。
David George:这是个颇具颠覆性的观点。
Andrew Bosworth:其实这不仅仅是穿戴设备的问题,连手机也一样。如果你今天重新设计一部手机,你还会照现在这样搞一个App Store吗?我觉得不会。
今天我们要解决一个问题,第一步不是去描述需求,而是选供应商。这个过程本身就带来很多限制。
但随着AI的“Agent能力”(agentic reasoning)越来越强,我们会越来越依赖它代劳,甚至在我们没有主动操作时也能帮我们处理任务。早期这可能更多是知识类的工作。
但等到真正落到消费场景里,用户会很快遇到瓶颈:他们会问AI:“你能帮我做这个吗?”AI回答:“我不行。”
这其实就是金矿——用户根本不知道他们其实在试图使用某个App,但需求已经非常明确了。我们可以把这种被动暴露出来的用户意图反馈给开发者:“每天有十万人在问这个问题。虽然他们不知道自己在找你这个服务,但这就是你的机会。如果你能对接上这个请求流,就能激活一波真实需求。”
甚至AI本身可以完成转化链路:“这个服务需要付费,要继续吗?”不管是订个流媒体会员,还是找个水管工人——都可以。这其实是在构建一种新型市场,不是靠某个产品经理在会议室里拍脑袋设计App,而是直接来源于真实世界的需求与失败,再由开发者来填补这些空白接口”。
David George:这个终局对用户来说非常诱人——如果能绕开品牌溢价,那太好了。
Andrew Bosworth:是的,但这也会非常混乱。它会催生一个全新的市场,竞争核心不再是品牌,而是性能和效率。品牌的存在感被弱化了——这对依赖品牌忠诚度的公司来说是个挑战。
用户不会在意音乐来自哪个平台,只要能顺利播放,他们就满意了。但品牌当然希望你在意,他们希望你建立情感连接。
David George:确实,有些场景你可能还在意品牌,但很多时候根本不会。
Andrew Bosworth:没错。以前App是为了抢你的注意力,所以品牌很重要。但如果未来是“我只想听一首好歌”,那决定要素就变成了交付质量。这对用户是利好——性价比变得更重要。但对公司来说,这会非常痛。
而且这还带来了另一个核心问题:你得非常信任AI,或者说,信任背后分发AI的人。
如果不同公司都提供AI服务,用户需要相信——这个推荐不是因为AI收了钱,而是它真心对我好。如果它背后被买通,只推荐利润最高的路径,那就彻底失去了价值。
David George:听起来这已经和现在的数字体验完全不是一个逻辑了。
Andrew Bosworth:是的,但你已经能看到它的早期雏形。有些公司现在已经在跟AI平台对接任务执行。但也有人说:“我不想让机器人来搞定这事,我要人流量直接导到我这来。”对他们来说,能不能拥有需求是生死问题。
这可能会变得很混乱,但从用户视角看,如果我们能避免付出品牌税,那就是更好的未来。
AI时代的“性能 vs. 价格”竞争
David George:这个转型过程会很混乱,但大概也是不可避免的。一旦用户进入那种由AI主导的高频交互循环,企业根本没得选——用户已经在那里了。肯定会有一些团队想抢先进入这个新世界,靠性能和价格打败那些有品牌护城河的旧势力。你觉得这种情况最早会在哪些领域发生?
Andrew Bosworth:这是个好问题。应该还是跟搜索量直接相关。其实我们已经有类似的历史案例了——早期Web时代Google的崛起就是模板。
在那之前,互联网的流量分发是靠索引目录,比如Yahoo、靠链接网络结构。想获得流量,你得想办法让别人给你导链接。但Google用了几年时间就颠覆了整个模型——一切都变成了“你在搜索流里排第几”。
谁能占据用户搜索的入口,谁就能定义行业格局。
David George:比如旅游行业,最典型。
Andrew Bosworth:对,旅游被颠覆得特别快。从旅行社是标配到旅行社基本消失,几乎就是几年之内发生的。
David George:而竞争核心也转向了执行效率——谁价格低、转化快,谁就能活。
Andrew Bosworth:是的。只不过现在SEO已经卷到一种很失控的状态了,体验反而变差了。尤其叠加AI后,这种现象更严重了。
David George:完全同意,现在的SEO更像是在同系统博弈,不是在服务用户。
Andrew Bosworth:对,最初它是一个“平权机制”(flattening effect),现在又变成一座座高墙——谁出得起钱,谁能买曝光位。这是一个很典型的警示故事:AI未来也可能走上这条路。
不过,我们眼前还是会经历一个黄金期。搜索流会直接揭示出用户的真实需求,开发者会快速跟进、构建新服务。各个垂直领域都会陆续“被翻盘”,消费者能在很短时间内体验到更好的解决方案。
但等到这些领域走向稳定态,游戏机制又会重新显现出来。
David George:那就是衰退期的开始。这也将是对AI系统的真正考验——它到底能不能避免落入“卷SEO、卖广告”的老套路。
开源、Llama,以及“商品化互补品”的战略思路
David George:我们换个话题。你在推动开源这件事上走得很前,能聊聊你们在这方面的战略吗?你理想中的AI模型市场结构会是怎样的?
Andrew Bosworth:Llama是从FAIR(Fundamental AI Research,Meta公司的基础研究团队)孵化出来的。FAIR从一开始就是坚持开源的,这也是为什么我们能吸引到很多顶级研究者。他们相信跨团队协作能让技术进展更快。
而且也不只是我们在做开源。Transformer论文最早是Google发的;而自监督学习这个方向,我们也做出了重要贡献。可以说,现在这个领域的进步,大家都是在共同推动。
我们发布最初版本Llama的时候,几乎所有主流模型都是开源的。但随后行业风向转了,大家开始转向闭源。但在那之前,行业的共识是:如果你做出了一个有价值的模型,你会开源它,让更多人用、也让别人验证。
Llama 2是一个重要的转折点。当时我们做出了一个明确的选择——我本人非常支持这个决定,Mark(Zuckerberg)也很认同,并公开写文章表态过。
我们的观点是:模型应该开源。
理由有两个:
第一,这样整个行业才能走得更快。真正颠覆性的创新,往往不是出自大实验室,而是一些小团队。你看中国的DeepSeek,他们压力很大,但却在Memory Architecture(记忆架构)等底层方向上做出了突破,效果非常惊人。
第二,这其实是一个经典的“Commoditize your complements”策略(ZP注:商品化互补品,是一种商业策略,意指将与自己产品互补的商品变得廉价或普及,从而增加自身产品的需求)。
我们的核心产品会因为AI而变得更好。这就是我们为什么这些年一直在AI上大投入。不管是推荐系统,还是WhatsApp里那种基于语义的搜索交互——只要底层AI能力上来了,体验就会提升。
但就算所有人都能用上同一套开源模型,他们也没法做出我们的产品。这种结构性的非对称对我们是有利的。
所以说,让基础模型变得商品化,对我们来说就是一个对商业有利的选择。同时,如果市面上有一批高性价比、甚至免费的模型,也能带动整个生态系统向上——不论是对创业者、学术界,还是对我们这个平台方来说,都是好事。
David George:所以这是一个商业模式和社会进步方向天然一致的例子?
Andrew Bosworth:是的。我们对“开放研究”的信念,和我们在业务上的定位,本质上是完全一致的,没有任何冲突。
后手机时代的风险与阻力
David George:我们聊点现实的。哪些因素会真正拖慢这场转型的进度?硬件瓶颈、AI能力、视觉系统、分辨率?开发者生态和原生应用我们也提过。你觉得哪些是线性问题,哪些是真正的风险点?
Andrew Bosworth:我们面临的是真实的“发明风险”(invention risk)——有可能我们想做的事情,当前技术根本还做不到,不只是我们,任何团队都做不到。
但话说回来,我认为已经有了可验证的窗口。你也看过Orion,说明这事是有可能实现的。现在的挑战是如何把成本降下来、材料做得更好。所以确实存在技术风险,但更大的其实是“接纳风险”(adoption risk)。
人们是否真的愿意接受这类技术?是否愿意学习全新的交互方式?我们都经历过打字学习曲线,如今手机操作对我们来说已经成了本能。那么问题来了——人们愿意为了这些新模态再重新学一套东西吗?对他们来说,值不值?
还有一个是生态风险。假设我们硬件造出来了,但只能发邮件、刷Reels——这显然不够。用户要的是一整套完整的日常使用场景都能支持,而不只是几个碎片功能。
不过说实话,我们对现在硬件的发展方向是有信心的;而在社会接受度这块,最近也比过去任何时候都更乐观。以前这点还不确定,但自从Ray-Ban Meta眼镜推出之后,我们明显感受到:人们对这类产品的接受度在提高。
当然,这里面也藏着很多复杂的社会与监管问题。你想想,我们现在手里这个设备,等于是一个超级感知机器:你的视觉更强了、听力更敏锐、记忆也更完备。
比如两年后我在街上遇到你,我记得我们录过一期播客,但我一时想不起你名字。这时候我能不能直接问设备:“我们在哪见过?他是谁?”——这类记忆增强行为是否可以接受?
这不是技术问题,而是伦理边界问题。它是你的脸,如果我大脑记得住,你不会觉得被侵犯;但如果是机器告诉我的,就变得模糊了。这条分界线在哪里?
这类隐私与社会规范上的模糊地带,是可能让整个愿景脱轨的关键风险。
David George:确实,越界的后果可能不仅仅是挨个批评,而是整个品类都被封杀。
Andrew Bosworth:没错。一旦在社会层面失控,整个技术路线可能就直接凉了。核能技术其实就是这样的案例——几十年被封锁的原因,现在回头看,其实没那么不可控,是叙事搞砸了,是忽视公众感受的后果。
所以我们现在对“技术能不能做出来”这块是相对有把握的;而在社会接受度这块,也比过去好很多了。但要说完全没问题?远远没有。
过去我一直认为生态缺口是最大的风险,但现在AI可能反而是那个“银弹”。
如果未来AI本身就是主界面,它就跟设备天然绑定,不再需要依赖传统App来构建生态。而且就算还只是Ray-Ban Meta(还没到Orion),已经有不少公司找我们,希望在上面做东西,超出预期。
它现在还不算一个平台,算力几乎没有,存储空间也极小。但我们已经和Be My Eyes合作了,它能帮助视障用户实时识别并导航现实世界,效果非常惊艳。
这只是一个小窗口,却能看到AI+可穿戴设备的巨大潜力。而市场的反应,比我们预期还要正面。
所以说,现在这个阶段,终于是顺风了。在经历了八九年的逆风之后,哪怕只来了一年顺风,我也毫不犹豫地接受它。
David George:还远没到庆祝胜利的时候,但确实走到了一个新阶段。
Andrew Bosworth:对,还是很难,一切随时都有可能失败。
David George:我特别赞同你从“发明风险”讲起。很多事,哪怕技术层面真的能做出来,不代表它会跑起来。
Andrew Bosworth:完全同意。我想说两点。
首先,Mark(Zuckerberg)真的值得肯定。他是真的相信AI——而我们整个团队也一样。我们不是跟风,我们是有明确信念的人。Mark深信这就是下一代计算平台,而这事不可能自然而然地发生。
它不会因为时间够久、技术足够成熟就自动到来。必须有人亲自把它做出来。正如我们首席科学家Michael Abrash常说的那样——“技术的必然性”是个神话。你不能指望某天它自然降临。
你得下定决心,停下手头其他事,把时间、资源、人力都投入进去,才能真的把未来造出来。我们现在就在做这件事。
这也是我们和其他人的本质区别——我们真的相信。对我来说,这可能是我一生中最重要的工作。
这是一个Xerox PARC级别的时代节点(ZP注:Xerox PARC(Palo Alto研究中心)是计算机史上的传奇机构,发明了图形界面、鼠标等奠定现代计算范式的技术),是一次重新定义人机交互方式的机会。这就像当年Licklider提出的人机协同(human-in-the-loop,HITL)——而现在我们终于看到AI正在把这个想法落地。
这种机会非常罕见,不是每一代技术人都能遇上的。可能一两代才出现一次。而我们这次不想错过。
我们会全力以赴。我们可能会失败,但绝不会因为信心不够或者努力不够而失败。
David George:很棒。感谢你今天的分享。
Andrew Bosworth:谢谢。
原文:What Comes After Mobile? Meta’s Andrew Bosworth on AI and Consumer Tech
https://www.youtube.com/watch?v=qEjTz2ZmxHI
编译:Kun Yang,关注AI对齐和AI Agent等科技领域。欢迎交流。
请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。
Z Potentials将继续提供更多关于人工智能、机器人、全球化等领域的优质内容。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。
(文:Z Potentials)