深度|Scale AI 95后华裔创始人:AI Agent的分水岭在于产品设计而非技术本身

图片来源:South Park commons

Z Highlights

  • 无论是创业初期还是其他阶段,焦虑和不确定性都会始终伴随在身边。但让我坚持下来的,是对未来的强烈信念。当我们想到Scale的核心想法时,我对未来一定会需要这种解决方案非常确信,尽管当下它还不存在。这种信念让我在不确定中仍然看到了一个明确的方向。

  • 最关键的一点是如何以创造性的方式解决问题,即便这些问题是看起来最不性感。我们在Scale所做的很多事情本质上是大规模的运营工作。问题本身听起来并不吸引人,但我们以和解决数学奥林匹克问题一样的态度来对待它,用科学的方法来分解并找到最优解。

  • 很多旧金山的人并没有真正独立思考。他们的想法更多来自推特或社交活动。你的任务就是不要成为这样的人,而是要培养独立思考的能力。这对创办一家公司至关重要,因为无论你在某个阶段是否受欢迎,你都需要能够抵御舆论的风暴。

  • 模型已经足够强大,能够支持一些AI agent产品或项目的应用,真正的突破在于如何设计出能够让消费者真正受益的代理产品

创业焦虑与信念的力量

Aditya Agarwal所以大家,请和我一起欢迎Alex来到SPC。我们非常兴奋能够接待你。SPC确实专注于创始人旅程的第零阶段。这意味着,在那些杂乱无章的想法海洋中,通过反复探讨、验证不同的想法,与人交流并测试它们的可行性。现在,请带我们回到你个人旅程的第零天。在你找到方向并开始规模化之前,你是否尝试过不同的想法?最初的构思过程对你来说是什么样的?

Alexandr Wang是的,我们确实经历了这样的阶段。在参加Y CombinatorYC)的时候,我想说,我们那一批的前半程可以形容为一种焦虑曲线你会经历许多存在主义式的困惑,比如不知道自己到底在做什么,也不知道生活的方向在哪里。

我还记得自己会去查阅那些谷歌文档寻找创业点子,并不断尝试提出新的想法。我读过Paul Graham的论文《如何提出创业点子》,那篇文章确实提供了一个非常有用的框架,特别是关于生活在未来的核心理念。这种方法让我能够想象未来可能存在的场景,然后尝试从未来逆向推导出现在应该做什么。

尽管如此,整个过程仍然充满不确定性,特别是在一个非常活跃的社区里。当你周围的人似乎都在忙着做自己的事情,而你还在摸索时,会感到很大的压力和焦虑。最终,我们想出了创建Scale的想法。这有点像一场完美风暴,各种因素巧妙地结合在了一起。

Aditya Agarwal在那种焦虑的状态下,你是如何应对的?回头看,这种经历可能看起来像是成长的仪式,但当你身处其中时,那确实是非常难熬的。你是正面迎击焦虑,还是随波逐流,一天一天地熬过去?

Alexandr Wang我认为,无论是创业初期还是其他阶段,焦虑和不确定性都会始终伴随在身边。但让我坚持下来的,是对未来的强烈信念。当我们想到Scale的核心想法时,我对未来一定会需要这种解决方案非常确信,尽管当下它还不存在。这种信念让我在不确定中仍然看到了一个明确的方向。

YC,我们经常听到“90%的初创公司最终会失败这样的说法。但失败并不像《饥饿游戏》那样瞬间发生,而是可能需要几年时间才显现。这是最让人恐惧的:你可能已经失败了,但要几年后才能发现。所以我会把所有的不确定性转化为执行力,用实际行动来应对焦虑。这让我觉得,尽管像坐过山车一样起伏,但至少我是在朝着正确的方向前进。

Aditya Agarwal你是否曾因为竞争对手而感到担忧?比如,当你看到其他人在做类似的事情时,是否会觉得自己的创意不够独特?

Alexandr Wang确实,当时有很多类似的产品和竞争者存在。但我认为,一个成功的创始人需要具备某种非理性的自信你必须相信自己的团队能够吸引更优秀的人才,做出更明智的决策,并更加执着于实现长期目标。这种信念会随着时间的推移累积,最终成为一种优势。

我还记得,有一次我问一位18岁的YC创始人,如何看待竞争。她的回答很简单:只要比别人做得更好就行。虽然听起来有些狂妄,但我认为这确实是答案的核心。只要你相信自己能够构建出更好的东西,并不断付诸实践,你就已经领先一步。

Aditya Agarwal这让我想起了Palantir的一个轶事。他们非常擅长让客户相信,如果没有他们的软件,客户的业务会变得更糟。相比之下,在Dropbox,我们倾向于让产品本身说话。但后来我们发现,这种方式有时并不足够。你怎么看?在Scale,你更倾向于专注于构建产品,还是倾向于销售和推广?或者说,你们找到了一种平衡方式?

Aditya Agarwal我认为你必须两者兼得,至少就我们所做的事情而言。在Scale,我们的客户数量虽然不多,但他们都是非常重要的大客户。

在这种环境中,我觉得我们需要认识到一个事实:感知即现实。尤其是当你与非常数据驱动的公司打交道时,可能感觉大家都在追求某种客观的共同现实。但现实是,大多数大企业和政府内部,感知往往比真实的现实更加重要。原因很简单,现实通常是痛苦的,很多人并不愿意面对,而是选择生活在他们所相信的观念中。

所以,当你开发企业产品时,你的工作不仅是改善现实本身,更重要的是去塑造人们对现实的感知。在这一点上,我认为Palantir做得非常出色。他们能够比大多数其他科技公司更好地塑造人们对他们产品的看法,因为他们对自己的能力充满信心。

Aditya Agarwal我觉得你刚才提到的很深刻。如果我理解正确,大多数公司,包括政府,都生活在某种既定的看法中,因为现实过于痛苦。所以你的工作不是超越现实,而是以一种更好的观念去替代那些糟糕的观念,对吗?

Alexandr Wang:对的。不过我要补充一点:你也应该创造实际的价值。这种分析方式有点像黑暗艺术”——即便你构建了一个优秀的产品,从根本上来说,你还需要学会如何塑造感知。

创造性解决问题和谦卑克服不性感挑战的力量

Aditya Agarwal或许我们可以稍微转向你个人的经历。显然,你非常有竞争力,而且充满自信,这很了不起。但除此之外,你认为自己什么时候能达到“10倍生产力的巅峰

Alexandr Wang对我个人来说,我认为最关键的一点是如何以创造性的方式解决问题,即便这些问题是看起来最不性感的。我们在Scale所做的很多事情本质上是大规模的运营工作。我们在全球范围内有成千上万的贡献者,负责生成模型所需的高质量数据。这个问题本身听起来并不吸引人,但我们以和解决数学奥林匹克问题一样的态度来对待它,用科学的方法来分解并找到最优解。

我们相信,伟大的科技公司都愿意对看似卑微的问题保持尊重。这种态度让我们得以设计出聪明的运营解决方案、高效的技术以及实用的产品。正是这种结合让我们在竞争中脱颖而出。

Aditya Agarwal提到的这些不性感的问题,通常是那些很难激励员工的问题,尤其是在硅谷。你是否尝试过通过文化建设,让这种度成为公司DNA的一部分?比如在招聘或员工入职方面,你是如何处理的?

Alexandr Wang是的。我认为,我们在公司内部始终鼓励员工关注他们工作的净经济影响,而不是仅仅追求技术难度。很多人在学校习惯了以解决高难度技术问题为荣,但我们认为,技术难度和经济价值之间往往存在反比关系。事实上,很多高经济价值的问题在技术上并不复杂,但它们可能非常琐碎,需要耐心和细致的解决方法。

我们希望员工能够清楚地认识到这些问题的重要性,并明白有效解决它们的经济影响。比如,Facebook曾采用类似的文化,他们提拔的是那些最有生产力的工程师,而不仅仅是解决了最复杂问题的人。这种文化让那些愿意处理不性感问题的人得到了应有的认可。

Aditya Agarwal是的,我的意思是,我认为你的观点是关于开源模型的,我认为我们将回顾Zack的决定,实际上有一个像前沿规模的开源模型在那种情况下非常关键。回到你的一个想法,也许是你的其他想法。显然,关于AI agent的讨论已经引发了很多兴奋,但目前看起来这些讨论还缺乏实际意义。你对此怎么看?比如,到2025年,你觉得AI Agent会发生什么变化?从消费者的角度来看,这种技术会如何发挥作用?我个人感觉,对于公司来说,这些技术的应用似乎更明确一些,但对于消费者,我还没有看到AI agent在日常生活中真正有趣的应用。我也没有在公司中看到特别真诚的应用。对此,你怎么看?

Alexandr Wang是的,我认为我们与AI agent以及模型的关系,总的来说是这样的:在单回合任务中,它们表现相当不错,响应迅速且准确。然而,当你增加任务的复杂性或者需要多回合的交互时,它们的性能会急剧下降。这种问题并不是每个人都会公开讨论,但这是目前的现实。AI Agent在像谷歌搜索这样的简单查询场景中表现很好,但在需要复杂推理或多步骤解决问题时,它们的表现会掉崖

这背后有两大原因。第一,行业必须在更高的灵活性和可靠性方面投入更多努力,以提升模型的一致性,使其更像一个实体,而不是一台简单的统计机器

目前,这些模型甚至无法理解它们自己不知道的事情。因此,当你进行多次交互时,它们很可能会提供看似合理但实际上毫无根据的回答。这种情况必须改变。我认为,未来AI agent分水岭时刻并不在技术能力本身,而是在产品设计上。模型已经足够强大,能够支持一些AI agent产品或项目的应用,真正的突破在于如何设计出能够让消费者真正受益的代理产品对这个房间里的许多人来说,这一点可能并不明显。我们这些经常与模型打交道的人知道它们的能力,但普通人并不了解。例如,Cursor是一个很好的案例,大多数工程师并不知道模型在这类任务中有多强大,但一旦你将模型整合到工作流程中,效率的提升就非常明显。我相信,消费者也会经历类似的时刻。这种将聊天范式转化为成熟工作流程的变化,可能是2025年最大的创业机会之一。

数据在推进AI模型中的重要性

Aditya Agarwal也许让我们谈谈一个显然的话题:构建下一代前沿模型的最大限制之一是数据的可获取性。你怎么看数据墙?这种限制有多真实?另外,你对合成数据在模型训练中的作用有什么看法?

Alexandr Wang是的,我认为过去1218个月的讨论主要集中在计算能力上,比如谁拥有更多芯片、更大的集群。这种对话缺乏深度,因为即使拥有更大的计算集群,数据限制仍然是一个关键问题。我们已经接近公开数据的极限,而进一步提升模型性能需要专门的数据集。这种数据墙进展瓶颈是非常真实的。

目前,模型的许多进展实际上来自训练后的优化,而不是预训练阶段。通过使用专门设计的高质量数据集,我们可以实现更大的突破。但合成数据的实验表明,它往往缺乏数据分布的真实丰富性,难以完全替代真实数据。因此,未来我们需要开发新形式的人类生成数据,以支持更高水平的模型应用。如果我们在扩展计算能力的同时同步扩展数据生产能力,AI的发展就可以持续推进。尽管可能不需要像过去讨论的那样大规模的集群(比如万亿美元级别),但仍然需要合理的大规模计算资源,比如千亿美元级的集群。

Aditya Agarwal是的,这听起来很有道理。之前的讨论更多关注谁拥有更大的集群,而现在新的瓶颈显然出现在数据获取上。那么,你认为在这个过程中,Scale所扮演的角色是什么?显然,你们在全球范围内的训练数据生产中占据了重要位置。是否有机会进一步扩大规模?

Alexandr Wang是的,我们的确需要全面增加数据生产的规模。可以说,在通往AGI的道路上,计算能力的增长曲线是指数级的,与之匹配的数据生产也需要呈指数级扩展。这意味着,计算和数据必须协同增长,任何一方的扩展都不能远远超越另一方。

在这种背景下,Scale的关键角色是确保高质量数据的持续生产,为数据和计算的共同扩展提供支持。这是我们能够推动AI发展的核心职责。

独立思考的重要性

Aditya Agarwal可能稍微改变一下话题。对今天在场的观众来说,很多人是 AI 公司的创始人。你觉得在AI领域创业与以往技术公司的创业有什么显著不同?

Alexandr Wang我认为在任何新技术领域,都会面临高度的不确定性和大量的噪音。AI行业也不例外。当前的AI领域有许多观点和论断,其中80%90%废话。很多人,包括投资者和行业人士,可能会自信地表达某些看法,但实际上这些看法往往是错误的。

例如,我们在2018年进行A轮融资时,其中一张幻灯片提到数据是AI系统的生命线。但当我们向红杉资本展示时,有一位合伙人断言:“AI不需要更多数据。这种观点显然是错误的,但在当时它听起来很有说服力。这是早期行业中的常见现象——很多观点看似合理,但却没有事实依据。


创业者需要弄清楚自己真正相信的是什么,并基于这种信念建立可执行的机制。同时,你需要保持开放的心态,从生态系统中学习,而不是盲目跟随趋势。有些公司通过迎合热点获得了巨额融资,但最终却失败了,因为它们的基础理念并不扎实。

如果你能够坚守核心信念,同时灵活调整策略以适应变化,那么你将在这个竞争激烈的领域中脱颖而出。这可能是AI创业中最重要的事情。

Aditya Agarwal是的,我会这么说。这可能对一些人有帮助,但我想分享一个有趣的结论,特别是对SPC的创始人来说。我认为很少有垂直行业真正拥有现任者,甚至很少有新兴赢家现在已经占据了主导地位。实际上,很多领域仍然充满了机会。这并不完全取决于你筹集了多少钱,甚至也不能仅通过使用指标来衡量,因为目前每个人的使用指标都有些低迷。所以,我认为不要被表面的繁荣迷惑。当然,你需要正确判断。与此同时,我也不认为在这个阶段应该过度关注竞争对手,因为现在依然有大量未开发的机会。如果有一群人在某个特定子领域重复类似的想法,那么采取稍微相反的策略可能会更有趣。

Alexandr Wang是的,总的来说,很多旧金山的人并没有真正独立思考。他们的想法更多来自推特或社交活动。你的任务就是不要成为这样的人,而是要培养独立思考的能力。这对创办一家公司至关重要,因为无论你在某个阶段是否受欢迎,你都需要能够抵御舆论的风暴。例如,像英伟达这样的大公司,在不同时间点可能不受欢迎,然后又变得炙手可热。这种潮起潮落是不可避免的,而你的使命就是在这些浪潮中坚持下去。

Aditya Agarwal是的。扎克伯格在Facebook的时候一直告诉我们:你永远不会像外界评价的那样糟糕,也不会像外界认为的那样优秀。当你挣扎的时候,要对自己保持信心;而当外界对你赞誉有加时,这可能也是一种迹象,说明你并没有足够批判性地思考问题,或者你正在迎合大流而缺乏独立性。所以,这种平衡既难以掌握,也很重要。

还有一个广为流传的硅谷神话是:要在AI领域竞争,你需要很多资金。我其实持相反的观点。我认为,即使在基础模型领域,依然有大量机会。这些机会可以通过在算法设计或数据源上的创新来实现,而不是简单地筹集巨额资金。你对此有共鸣吗?

Alexandr Wang是的,如果你的商业计划需要大量资金,因为你必须花费大量资金来实现它,那么这本身就是一种困境。显然,你想建立一家盈利的公司,并构建一个能带来持续回报的商业模式。如果你需要烧很多钱,那只会让你陷入更深的风险中。硅谷经常陷入一种宏大目标的竞赛中,比如试图控制上帝的基础模型以成为世界的主宰者。如果这是你的目标,那么你确实需要大量资金,但这可能不是大多数人的目标。

大多数公司更应该关注构建一个长期盈利且可持续增长的业务模型。例如,自动驾驶汽车行业是一个前车之鉴。上百亿美元被投入这个领域,但最终几乎没有公司实现了预期目标。Waymo可能是唯一的例外,但他们的成功更多依赖于母公司谷歌的无限资金支持。如果你选择在基础模型领域直接与那些资金几乎无限的公司竞争,比如微软,这并不是一个好策略。相反,应该思考更具创造性和差异化的方式,找到可以长期投入的方向。

AI领域,目前最重要的溢价在于专注。例如,OpenAIAnthropic和谷歌这些巨头虽然强大,但它们需要同时关注无数的事情。而小型公司可以在特定领域深入挖掘。像Perplexity这样的产品在基于简单搜索的LLaMA输出中表现非常出色。他们的成功并不是因为烧了很多钱,而是因为专注。这种专注在当前AI创业环境中尤为宝贵。

Aditya Agarwal好的,接下来我们会向观众开放提问。大家可以开始思考自己的问题了。不过,在此之前,我还有一个问题。Alex,你现在还写代码吗?

Alexandr Wang不怎么写了,不过前几天我试用了Cursor,想看看它能否帮助我重新适应。这是一个很棒的产品,但要完全垄断工作流程是非常困难的。开发者通常很挑剔,也容易尝试新工具。如果Cursor能找到扎根的方法,它会更好地巩固自己的地位。

Aditya Agarwal是的,开发者确实很挑剔。我也对Cursor有类似的看法:可能会因为三件小问题不喜欢它,而忽略了它的十个优点。

观众提问

Aditya Agarwal好的,现在我们向观众开放提问。

观众问题Alex,你怎么看合成数据在后期训练中的作用?你认为这是一个技术性的问题,还是更深层的结构性问题?

Alexandr Wang合成数据在后期训练中确实有效,但它并不是点石成金的灵丹妙药。合成数据需要利用底层数据的结构,结合先验知识来生成更丰富的合成样本。这是一种有效的训练范式,但它并不能解决我们所有的数据扩展需求。所以,我认为合成数据是世界级后期训练的一部分,但并不是AI扩展的全部解决方案。

观众问题为什么你选择从大企业客户入手,而不是从中小型企业开始?对想专注于企业的创业者有什么建议吗?

Alexandr Wang大企业客户的主要挑战在于复杂性。大型企业内部常常有层层官僚机构,你需要学会如何清除这些障碍。如果成功了,企业客户的回报会非常可观。但与中小型企业相比,大企业客户的合作难度更高,因为你需要花费大量时间应对复杂的组织结构。

对于初创企业来说,如果你想快速起步,中小型企业确实是更显而易见的路径。它们的决策更快,执行起来更简单。但如果你选择专注于大企业客户,就需要做好面对复杂官僚流程的准备,同时在竞争中找到自己的独特定位。

Aditya Agarwal非常感谢,Alex,今天与你的交流非常精彩!

Alexandr Wang谢谢大家!

原视频:Alexandr WangScale AI& the Startup Hunger Games

https://www.youtube.com/watch?v=CEebe451GZs&t=11s 

编译:David


——-

(文:Z Potentials)

欢迎分享

发表评论