做浏览器、买Chrome、争AI OS,Perplexity也想「上牌桌」

Perplexity CEO Aravind Srinivas 近日在接受 TheVerge 采访时表示,「Perplexity 最终的目标是构建像 Windows、Mac、Android 或 iOS 这样的操作系统,操作系统才是最终极的战场。」

上个月,Perplexity 宣布要进军浏览器市场,即将推出一款名为「Comet」的自有浏览器。Srinivas 认为,「谁能拥有最丰富的用户上下文信息,谁就能赢得记忆能力的竞争。ChatGPT 对用户在 Instagram 或 Amazon 上购买了什么一无所知,它也不知道用户在不同网站上花费的时间。要想实现真正深入的用户个性化,必须要拥有所有这些数据。这不仅仅是基于检索历史查询来推出简单的记忆功能,因为后者是很容易被复制的。」

而通过浏览器获取用户在不同应用和网站上的全面上下文信息(如交易、浏览历史),将是实现深度个性化和构建 Agent 的最佳途径。

大家都想成为 AI 时代的 Chrome。有传言称, OpenAI 也正在研发其自有的浏览器。

在 TheVerge 的最新的一篇采访文章中,Srinivas 分享了其与 Motorola 的合作、如何与 Google 抗衡、以及为什么要做浏览器等。


Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后工作人员会拉你入群~
进群之后,你有机会得到:
  • 高浓度的主流模型(如 DeepSeek 等)开发交流;

  • 资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;

  • 好用、有趣的产品/案例,Founder Park 会主动做宣传。


Perplexity 创始人兼 CEO  Aravind Srinivas 正在与科技巨头 Google 展开较量,力争让其 AI 助手 Perplexity 得以预装在 Android 手机中。与此同时,这位 CEO 正将其这家初创公司的战略重心,转移至他预判将成为 AI 领域下一个重要战场的阵地:网页浏览器。

Srinivas 向 TheVerge 透露,Perplexity 计划下个月推出一款名为「Comet」的自有浏览器。他解释说:「我们之所以开发浏览器,是因为这可能是构建 Agent 的最佳途径。」 他进一步阐释:「浏览器本质上是一个容器化的操作系统。它能够让你在已登录状态下,通过隐藏标签页访问其他第三方服务,在客户端抓取页面数据,并能代表用户进行推理和执行操作。」

事实上,也有其他 AI 公司也在朝这个方向探索。例如, OpenAI 的 Operator 和 Google 的 Mariner 都需要借助浏览器来执行指令和控制网站。 OpenAI 至今尚未发布自家的浏览器,但有传言称其正在研发中。与此同时,鉴于美国政府此前判定 Google 在搜索市场构成垄断, Google 可能面临被迫出售 Chrome 浏览器的压力。

Perplexity 的一位高管曾表示,如果 Chrome 浏览器从 Google 剥离, Perplexity 希望能接手运营。而 OpenAI 也对此表达了兴趣,老牌公司 Yahoo 也对购买 Chrome 有兴趣。尽管 Chrome 的未来尚不明朗,但针对 Google 的反垄断审查无疑为 Perplexity 带来了机遇,使其得与 Android 手机制造商洽谈分销合作。

近期,Motorola 宣布 Perplexity 将预装在其新款 Razr 手机上。对于 Srinivas 所称的人工智能「答案引擎」而言,这意味着潜在的数百万新增用户。他坦言,尽管此次集成并非他与 Motorola 最初期望的那样深度,但对于 Perplexity 这类规模较小的初创公司而言,他仍视其为一次重大突破。


01 
通过分销和合作来撬动 Google 的主导地位

Q:能否详细谈谈与 Motorola 的合作是如何促成的,以及你们在与 Google 竞争中遇到的挑战?

Srinivas:当我们向 Motorola 展示今年一月我们推出的 Perplexity Android 助手演示时,合作洽谈进程明显加快了。在 Motorola 试用后,发现该助手运行稳定可靠,远胜于 Google 的 Gemini 。同时,他们对预装我们的应用并推送通知提示用户将 Perplexity 设为默认助手表现出了极大的兴趣。但 Google 介入阻止了他们,明确表示如果 Motorola 不将 Gemini 设为默认系统,就不能使用 Play Store 和官方 Android 版本发布新手机。

正如前面提到的,如果 Google 没有经历 DOJ 的审判,这次合作就无法实现。他们会故技重施,向众多 OEM 厂商施压。我曾与一些电信运营商沟通,他们甚至因为担心一旦被 Mountain View 注意到会导致营收分成受损,而不敢与我们进行任何实质性接触或安排会议。

Motorola 如果要更改默认设置,需要多达七八个步骤。这足以说明 Google 在 Android 生态中仍握有强大的控制权。

Q:手机厂商三星也是你们的投资者。按理说,这应该会促成某种合作,就像你们与 Motorola 宣布的那样,对吗?

Srinivas:是的,我非常希望我们能找到合作的方式。至于由谁获得默认地位,或者是否会作为用户首次设置的环节,这一切都还在探讨中。

Q:听起来,你非常看重通过分销和合作伙伴关系来推动 Perplexity 的增长。

Srinivas:我们的态度是愿意与任何人合作。我们已经与电信运营商展开了合作,接下来希望拓展到 OEM 厂商。下一步是推出浏览器,并会开发 Mac 和 Windows 版本。届时,我们也会寻求与这些平台的 OEM 厂商合作。

就像 Google 在 Android 领域与 OEM 厂商建立了紧密关系一样, Microsoft 在笔记本电脑领域与 OEM 厂商的合作协议甚至更为苛刻。因此,我们在这条战线上同样面临一场艰难的爬坡战。我们必须保持策略性,努力抗争。很难找到有人会客观地认为 Microsoft 的 Copilot 是一个比 Perplexity 更好的产品,但 Copilot 却是 Windows 系统中唯一预装的 AI 助手。

Q:你们刚刚在 iOS 上发布了助手,该助手的功能似乎让很多人感到惊讶。 Apple 是否为此给了你们特殊权限来控制其他应用?

Srinivas:Apple 并未给予我们特殊权限。用户无法通过我们的系统设置闹钟、启用低电量模式、调节屏幕亮度或音量,也无法控制手电筒的开关。同样,无法用来拨打电话或发送 iMessage 。

我们之所以能做到某些集成,是因为我们使用了 Apple EventKit SDK 。这个开发工具包开放了对 Reminders (提醒事项)、 Podcasts (播客)、 Apple Music (苹果音乐)、 Apple Maps (苹果地图)以及一些其他 Apple 应用的访问。我们能够调用该 SDK ,并结合我们自己的搜索基础设施和深度链接技术,实现与 YouTube、Uber 等应用的交互。

很多人诟病 Siri 不够智能,但在设置闹钟和拨打电话这些基本功能上, Siri 是可以正常工作的。 Siri 的不足之处在于,它无法准确找到用户想要的歌曲、播客和 YouTube 视频,无法设置更智能化的提醒,也无法便捷地叫到 Uber 网约车。我认为, Perplexity 在后者的这些使用场景上做得非常出色。



02 

构建操作系统级 Agent,

浏览器是最佳「容器」

Q:你们开发浏览器的原因是什么?以及何时会推出?

Srinivas:正如之前所说,我们开发浏览器的原因在于,这可能是构建「Agent」的最佳途径。在 iOS 和 Android 这样的移动操作系统上,我们没有系统层面的控制权,很难直接调用其他应用并获取它们的信息。虽然可以通过深度链接跳转,但比如在 Uber 的例子中,我无法便捷地比较不同 Uber 车型(如 Comfort )的价格,即使价格差异不大。我无法对比 Uber 和 Lyft 的价格来找到最优选择。我也无法比较 Uber Eats 和 DoorDash 的送餐等待时间来确定最佳点餐方案。

因此,我们需要构建一个具备操作系统级别能力的 Agent。而浏览器本质上就是一个容器化的操作系统。它能够让你在已登录状态下,通过隐藏标签页访问其他第三方服务,在客户端抓取页面数据,并能代表用户进行推理和执行操作。这种架构设计正是我们所看重的。

未来,Agent 能够简单地回答用户问题将变得像商品一样普遍,不再具备差异化优势。我们需要在执行行动的能力上建立新的竞争壁垒,这正是我们构建浏览器的初衷。浏览器是帮助用户采取行动的最佳平台。我们希望将用户交互界面转移到一个新的前沿阵地。



03 

跨平台用户个性化数据是关键,

构建 AI 操作系统才是终极目标

Q:你们是否担心 ChatGPT 的巨大规模,以及它对许多用户而言已经足够好,以至于他们不会再尝试 Perplexity ? ChatGPT 还在通过记忆用户交互和实现个性化来建立用户的粘性。

Srinivas:我认为 OpenAI 的策略,至少从 Sam Altman 在接受 Ben Thompson 采访时的表述来看,是鼓励第三方应用集成「使用 ChatGPT 登录」按钮,然后通过这种方式将所有用户数据汇入 ChatGPT 。但这需要说服所有第三方应用都能提供这一登录选项。

Perplexity 的策略是让用户可以在他们当前使用的应用中保持登录状态。我们将通过构建浏览器,在客户端代表用户访问各种应用。

我认为,谁能拥有最丰富的用户上下文信息,谁就能赢得记忆能力的竞争。 ChatGPT 对用户在 Instagram 或 Amazon 上购买了什么一无所知,它也不知道用户在不同网站上花费的时间。要想实现真正深入的用户个性化,必须拥有所有这些数据。这不仅仅是基于检索历史查询来推出简单的记忆功能,后者是很容易被复制的。

真正困难的是如何以跨平台的方式,将用户的交易记录、购物历史、浏览历史以及你在浏览器上的所有数据,无缝导入到 AI 助手中。这就是为什么我们不仅需要在网页端开发浏览器,也需要在移动端开发,并在所有应用之间共享 cookie 。这是我们面临的巨大挑战。

Q:听起来你认为浏览器是你们构建的产品的「终极目的地」?

Srinivas:不止于此,我们最终的目标是构建像 Windows、Mac、Android 或 iOS 这样的操作系统。浏览器相对受限且容器化。操作系统才是最终极的战场。



04 

融资、竞购 TikTok、训练数据问题

Q:你们曾因抓取内容而引发不少出版商的不满。现在你们已经开始向其中一部分出版商支付费用。你们认为目前与出版商的关系是否已是良好的状态,还是仍有待进一步改善?

Srinivas:我认为还有更多工作要做,但现在的情况比我们上次沟通时已经好很多了。我们在抓取时严格遵循了 robots.txt 协议。对于任何不允许我们抓取的内容,我们都只依赖第三方数据提供商提供的数据。

Q:据报道,你们正在以 180 亿美元的估值筹集数亿美元资金。你们计划如何使用这笔资金?

Srinivas:要想可靠地构建 Agent,需要利用最前沿的推理模型。当前成本高昂的技术,在一年后很可能变得非常便宜,但我们不能等到那时。我们需要尽快将这些能力推广给尽可能多的用户,以便收集海量数据,将其提炼压缩到更小的模型中,从而降低运营成本。

Q:关于竞购 TikTok 的进展如何?最近是否与白宫有过沟通?之前曾有关于你们如何筹集资金的疑问。

Srinivas:我还没有放弃竞购,但我认为自己赢得的几率并不高,这一点我想大家都很清楚。我不认为资金是主要问题,有足够的投资人愿意支持我。

我们从 ByteDance 方面听到的消息也并非是关于资金的担忧,更多是关于他们是否愿意放弃对算法的控制权。我认为他们希望保留所有权和控制权,并且相信没有人能比他们做得更好。而且,在美国和欧洲运行的 TikTok 应用在技术架构上紧密关联,很难完全解耦。未来,关税等贸易政策也将影响一切,包括 TikTok 的命运。



(文:Founder Park)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往