图片来源:South Park commons
Z Highlights
-
无论是创业初期还是其他阶段,焦虑和不确定性都会始终伴随在身边。但让我坚持下来的,是对未来的强烈信念。当我们想到Scale的核心想法时,我对未来一定会需要这种解决方案非常确信,尽管当下它还不存在。这种信念让我在不确定中仍然看到了一个明确的方向。
-
最关键的一点是如何以创造性的方式解决问题,即便这些问题是看起来最“不性感”的。我们在Scale所做的很多事情本质上是大规模的运营工作。问题本身听起来并不吸引人,但我们以和解决数学奥林匹克问题一样的态度来对待它,用科学的方法来分解并找到最优解。
-
很多旧金山的人并没有真正独立思考。他们的想法更多来自推特或社交活动。你的任务就是不要成为这样的人,而是要培养独立思考的能力。这对创办一家公司至关重要,因为无论你在某个阶段是否受欢迎,你都需要能够抵御舆论的风暴。
-
模型已经足够强大,能够支持一些AI agent产品或项目的应用,真正的突破在于如何设计出能够让消费者真正受益的代理产品。
创业焦虑与信念的力量
Aditya Agarwal:所以大家,请和我一起欢迎Alex来到SPC。我们非常兴奋能够接待你。SPC确实专注于创始人旅程的“第零阶段”。这意味着,在那些杂乱无章的想法海洋中,通过反复探讨、验证不同的想法,与人交流并测试它们的可行性。现在,请带我们回到你个人旅程的“第零天”。在你找到方向并开始规模化之前,你是否尝试过不同的想法?最初的构思过程对你来说是什么样的?
Alexandr Wang:是的,我们确实经历了这样的阶段。在参加Y Combinator(YC)的时候,我想说,我们那一批的前半程可以形容为一种“焦虑曲线”。你会经历许多存在主义式的困惑,比如不知道自己到底在做什么,也不知道生活的方向在哪里。
我还记得自己会去查阅那些谷歌文档寻找创业点子,并不断尝试提出新的想法。我读过Paul Graham的论文《如何提出创业点子》,那篇文章确实提供了一个非常有用的框架,特别是关于“生活在未来”的核心理念。这种方法让我能够想象未来可能存在的场景,然后尝试从未来逆向推导出现在应该做什么。
尽管如此,整个过程仍然充满不确定性,特别是在一个非常活跃的社区里。当你周围的人似乎都在忙着做自己的事情,而你还在摸索时,会感到很大的压力和焦虑。最终,我们想出了创建Scale的想法。这有点像一场“完美风暴”,各种因素巧妙地结合在了一起。
Aditya Agarwal:在那种焦虑的状态下,你是如何应对的?回头看,这种经历可能看起来像是成长的仪式,但当你身处其中时,那确实是非常难熬的。你是正面迎击焦虑,还是随波逐流,一天一天地熬过去?
Alexandr Wang:我认为,无论是创业初期还是其他阶段,焦虑和不确定性都会始终伴随在身边。但让我坚持下来的,是对未来的强烈信念。当我们想到Scale的核心想法时,我对未来一定会需要这种解决方案非常确信,尽管当下它还不存在。这种信念让我在不确定中仍然看到了一个明确的方向。
在YC,我们经常听到“90%的初创公司最终会失败”这样的说法。但失败并不像《饥饿游戏》那样瞬间发生,而是可能需要几年时间才显现。这是最让人恐惧的:你可能已经失败了,但要几年后才能发现。所以我会把所有的不确定性转化为执行力,用实际行动来应对焦虑。这让我觉得,尽管像坐过山车一样起伏,但至少我是在朝着正确的方向前进。
Aditya Agarwal:你是否曾因为竞争对手而感到担忧?比如,当你看到其他人在做类似的事情时,是否会觉得自己的创意不够独特?
Alexandr Wang:确实,当时有很多类似的产品和竞争者存在。但我认为,一个成功的创始人需要具备某种“非理性的自信”。你必须相信自己的团队能够吸引更优秀的人才,做出更明智的决策,并更加执着于实现长期目标。这种信念会随着时间的推移累积,最终成为一种优势。
我还记得,有一次我问一位18岁的YC创始人,如何看待竞争。她的回答很简单:“只要比别人做得更好就行。”虽然听起来有些狂妄,但我认为这确实是答案的核心。只要你相信自己能够构建出更好的东西,并不断付诸实践,你就已经领先一步。
Aditya Agarwal:这让我想起了Palantir的一个轶事。他们非常擅长让客户相信,如果没有他们的软件,客户的业务会变得更糟。相比之下,在Dropbox,我们倾向于让产品本身说话。但后来我们发现,这种方式有时并不足够。你怎么看?在Scale,你更倾向于专注于构建产品,还是倾向于销售和推广?或者说,你们找到了一种平衡方式?
Aditya Agarwal:我认为你必须两者兼得,至少就我们所做的事情而言。在Scale,我们的客户数量虽然不多,但他们都是非常重要的大客户。
在这种环境中,我觉得我们需要认识到一个事实:感知即现实。尤其是当你与非常数据驱动的公司打交道时,可能感觉大家都在追求某种客观的共同现实。但现实是,大多数大企业和政府内部,感知往往比真实的现实更加重要。原因很简单,现实通常是痛苦的,很多人并不愿意面对,而是选择生活在他们所相信的观念中。
所以,当你开发企业产品时,你的工作不仅是改善现实本身,更重要的是去塑造人们对现实的感知。在这一点上,我认为Palantir做得非常出色。他们能够比大多数其他科技公司更好地塑造人们对他们产品的看法,因为他们对自己的能力充满信心。
Aditya Agarwal:我觉得你刚才提到的很深刻。如果我理解正确,大多数公司,包括政府,都生活在某种既定的看法中,因为现实过于痛苦。所以你的工作不是超越现实,而是以一种更好的观念去替代那些糟糕的观念,对吗?
Alexandr Wang:对的。不过我要补充一点:你也应该创造实际的价值。这种分析方式有点像“黑暗艺术”——即便你构建了一个优秀的产品,从根本上来说,你还需要学会如何塑造感知。
创造性解决问题和谦卑克服“不性感”挑战的力量
Aditya Agarwal:或许我们可以稍微转向你个人的经历。显然,你非常有竞争力,而且充满自信,这很了不起。但除此之外,你认为自己什么时候能达到“10倍生产力的巅峰”?
Alexandr Wang:对我个人来说,我认为最关键的一点是如何以创造性的方式解决问题,即便这些问题是看起来最“不性感”的。我们在Scale所做的很多事情本质上是大规模的运营工作。我们在全球范围内有成千上万的贡献者,负责生成模型所需的高质量数据。这个问题本身听起来并不吸引人,但我们以和解决数学奥林匹克问题一样的态度来对待它,用科学的方法来分解并找到最优解。
我们相信,伟大的科技公司都愿意对“看似卑微的问题”保持尊重。这种态度让我们得以设计出聪明的运营解决方案、高效的技术以及实用的产品。正是这种结合让我们在竞争中脱颖而出。
Aditya Agarwal:你提到的这些“不性感”的问题,通常是那些很难激励员工的问题,尤其是在硅谷。你是否尝试过通过文化建设,让这种态度成为公司DNA的一部分?比如在招聘或员工入职方面,你是如何处理的?
Alexandr Wang:是的。我认为,我们在公司内部始终鼓励员工关注他们工作的“净经济影响”,而不是仅仅追求技术难度。很多人在学校习惯了以解决高难度技术问题为荣,但我们认为,技术难度和经济价值之间往往存在反比关系。事实上,很多高经济价值的问题在技术上并不复杂,但它们可能非常琐碎,需要耐心和细致的解决方法。
我们希望员工能够清楚地认识到这些问题的重要性,并明白有效解决它们的经济影响。比如,Facebook曾采用类似的文化,他们提拔的是那些最有生产力的工程师,而不仅仅是解决了最复杂问题的人。这种文化让那些愿意处理“不性感问题”的人得到了应有的认可。
Aditya Agarwal:是的,我的意思是,我认为你的观点是关于开源模型的,我认为我们将回顾Zack的决定,实际上有一个像前沿规模的开源模型在那种情况下非常关键。回到你的一个想法,也许是你的其他想法。显然,关于AI agent的讨论已经引发了很多兴奋,但目前看起来这些讨论还缺乏实际意义。你对此怎么看?比如,到2025年,你觉得AI Agent会发生什么变化?从消费者的角度来看,这种技术会如何发挥作用?我个人感觉,对于公司来说,这些技术的应用似乎更明确一些,但对于消费者,我还没有看到AI agent在日常生活中真正有趣的应用。我也没有在公司中看到特别真诚的应用。对此,你怎么看?
Alexandr Wang:是的,我认为我们与AI agent以及模型的关系,总的来说是这样的:在单回合任务中,它们表现相当不错,响应迅速且准确。然而,当你增加任务的复杂性或者需要多回合的交互时,它们的性能会急剧下降。这种问题并不是每个人都会公开讨论,但这是目前的现实。AI Agent在像谷歌搜索这样的简单查询场景中表现很好,但在需要复杂推理或多步骤解决问题时,它们的表现会“掉崖”。
这背后有两大原因。第一,行业必须在更高的灵活性和可靠性方面投入更多努力,以提升模型的一致性,使其更像一个实体,而不是一台简单的“统计机器”。
目前,这些模型甚至无法理解它们自己不知道的事情。因此,当你进行多次交互时,它们很可能会提供看似合理但实际上毫无根据的回答。这种情况必须改变。我认为,未来AI agent的“分水岭时刻”并不在技术能力本身,而是在产品设计上。模型已经足够强大,能够支持一些AI agent产品或项目的应用,真正的突破在于如何设计出能够让消费者真正受益的代理产品。对这个房间里的许多人来说,这一点可能并不明显。我们这些经常与模型打交道的人知道它们的能力,但普通人并不了解。例如,Cursor是一个很好的案例,大多数工程师并不知道模型在这类任务中有多强大,但一旦你将模型整合到工作流程中,效率的提升就非常明显。我相信,消费者也会经历类似的时刻。这种将“聊天范式”转化为成熟工作流程的变化,可能是2025年最大的创业机会之一。
数据在推进AI模型中的重要性
Aditya Agarwal:也许让我们谈谈一个显然的话题:构建下一代前沿模型的最大限制之一是数据的可获取性。你怎么看“数据墙”?这种限制有多真实?另外,你对合成数据在模型训练中的作用有什么看法?
Alexandr Wang:是的,我认为过去12到18个月的讨论主要集中在计算能力上,比如谁拥有更多芯片、更大的集群。这种对话缺乏深度,因为即使拥有更大的计算集群,数据限制仍然是一个关键问题。我们已经接近公开数据的极限,而进一步提升模型性能需要专门的数据集。这种“数据墙”和“进展瓶颈”是非常真实的。
目前,模型的许多进展实际上来自训练后的优化,而不是预训练阶段。通过使用专门设计的高质量数据集,我们可以实现更大的突破。但合成数据的实验表明,它往往缺乏数据分布的真实丰富性,难以完全替代真实数据。因此,未来我们需要开发新形式的人类生成数据,以支持更高水平的模型应用。如果我们在扩展计算能力的同时同步扩展数据生产能力,AI的发展就可以持续推进。尽管可能不需要像过去讨论的那样大规模的集群(比如万亿美元级别),但仍然需要合理的大规模计算资源,比如千亿美元级的集群。
Aditya Agarwal:是的,这听起来很有道理。之前的讨论更多关注谁拥有更大的集群,而现在新的瓶颈显然出现在数据获取上。那么,你认为在这个过程中,Scale所扮演的角色是什么?显然,你们在全球范围内的训练数据生产中占据了重要位置。是否有机会进一步扩大规模?
Alexandr Wang:是的,我们的确需要全面增加数据生产的规模。可以说,在通往AGI的道路上,计算能力的增长曲线是指数级的,与之匹配的数据生产也需要呈指数级扩展。这意味着,计算和数据必须协同增长,任何一方的扩展都不能远远超越另一方。
在这种背景下,Scale的关键角色是确保高质量数据的持续生产,为数据和计算的共同扩展提供支持。这是我们能够推动AI发展的核心职责。
独立思考的重要性
Aditya Agarwal:可能稍微改变一下话题。对今天在场的观众来说,很多人是 AI 公司的创始人。你觉得在AI领域创业与以往技术公司的创业有什么显著不同?
Alexandr Wang:我认为在任何新技术领域,都会面临高度的不确定性和大量的噪音。AI行业也不例外。当前的AI领域有许多观点和论断,其中80%到90%是“废话”。很多人,包括投资者和行业人士,可能会自信地表达某些看法,但实际上这些看法往往是错误的。
例如,我们在2018年进行A轮融资时,其中一张幻灯片提到“数据是AI系统的生命线”。但当我们向红杉资本展示时,有一位合伙人断言:“AI不需要更多数据。”这种观点显然是错误的,但在当时它听起来很有说服力。这是早期行业中的常见现象——很多观点看似合理,但却没有事实依据。
创业者需要弄清楚自己真正相信的是什么,并基于这种信念建立可执行的机制。同时,你需要保持开放的心态,从生态系统中学习,而不是盲目跟随趋势。有些公司通过迎合热点获得了巨额融资,但最终却失败了,因为它们的基础理念并不扎实。
如果你能够坚守核心信念,同时灵活调整策略以适应变化,那么你将在这个竞争激烈的领域中脱颖而出。这可能是AI创业中最重要的事情。
Aditya Agarwal:是的,我会这么说。这可能对一些人有帮助,但我想分享一个有趣的结论,特别是对SPC的创始人来说。我认为很少有垂直行业真正拥有现任者,甚至很少有新兴赢家现在已经占据了主导地位。实际上,很多领域仍然充满了机会。这并不完全取决于你筹集了多少钱,甚至也不能仅通过使用指标来衡量,因为目前每个人的使用指标都有些低迷。所以,我认为不要被表面的繁荣迷惑。当然,你需要正确判断。与此同时,我也不认为在这个阶段应该过度关注竞争对手,因为现在依然有大量未开发的机会。如果有一群人在某个特定子领域重复类似的想法,那么采取稍微相反的策略可能会更有趣。
Alexandr Wang:是的,总的来说,很多旧金山的人并没有真正独立思考。他们的想法更多来自推特或社交活动。你的任务就是不要成为这样的人,而是要培养独立思考的能力。这对创办一家公司至关重要,因为无论你在某个阶段是否受欢迎,你都需要能够抵御舆论的风暴。例如,像英伟达这样的大公司,在不同时间点可能不受欢迎,然后又变得炙手可热。这种潮起潮落是不可避免的,而你的使命就是在这些浪潮中坚持下去。
Aditya Agarwal:是的。扎克伯格在Facebook的时候一直告诉我们:“你永远不会像外界评价的那样糟糕,也不会像外界认为的那样优秀。”当你挣扎的时候,要对自己保持信心;而当外界对你赞誉有加时,这可能也是一种迹象,说明你并没有足够批判性地思考问题,或者你正在迎合大流而缺乏独立性。所以,这种平衡既难以掌握,也很重要。
还有一个广为流传的硅谷神话是:要在AI领域竞争,你需要很多资金。我其实持相反的观点。我认为,即使在基础模型领域,依然有大量机会。这些机会可以通过在算法设计或数据源上的创新来实现,而不是简单地筹集巨额资金。你对此有共鸣吗?
Alexandr Wang:是的,如果你的商业计划需要大量资金,因为你必须花费大量资金来实现它,那么这本身就是一种困境。显然,你想建立一家盈利的公司,并构建一个能带来持续回报的商业模式。如果你需要烧很多钱,那只会让你陷入更深的风险中。硅谷经常陷入一种宏大目标的竞赛中,比如试图控制“上帝的基础模型”以成为世界的主宰者。如果这是你的目标,那么你确实需要大量资金,但这可能不是大多数人的目标。
大多数公司更应该关注构建一个长期盈利且可持续增长的业务模型。例如,自动驾驶汽车行业是一个前车之鉴。上百亿美元被投入这个领域,但最终几乎没有公司实现了预期目标。Waymo可能是唯一的例外,但他们的成功更多依赖于母公司谷歌的无限资金支持。如果你选择在基础模型领域直接与那些资金几乎无限的公司竞争,比如微软,这并不是一个好策略。相反,应该思考更具创造性和差异化的方式,找到可以长期投入的方向。
在AI领域,目前最重要的溢价在于专注。例如,OpenAI、Anthropic和谷歌这些巨头虽然强大,但它们需要同时关注无数的事情。而小型公司可以在特定领域深入挖掘。像Perplexity这样的产品在基于简单搜索的LLaMA输出中表现非常出色。他们的成功并不是因为烧了很多钱,而是因为专注。这种专注在当前AI创业环境中尤为宝贵。
Aditya Agarwal:好的,接下来我们会向观众开放提问。大家可以开始思考自己的问题了。不过,在此之前,我还有一个问题。Alex,你现在还写代码吗?
Alexandr Wang:不怎么写了,不过前几天我试用了Cursor,想看看它能否帮助我重新适应。这是一个很棒的产品,但要完全垄断工作流程是非常困难的。开发者通常很挑剔,也容易尝试新工具。如果Cursor能找到扎根的方法,它会更好地巩固自己的地位。
Aditya Agarwal:是的,开发者确实很挑剔。我也对Cursor有类似的看法:可能会因为三件小问题不喜欢它,而忽略了它的十个优点。
观众提问
Aditya Agarwal:好的,现在我们向观众开放提问。
观众问题:Alex,你怎么看合成数据在后期训练中的作用?你认为这是一个技术性的问题,还是更深层的结构性问题?
Alexandr Wang:合成数据在后期训练中确实有效,但它并不是“点石成金”的灵丹妙药。合成数据需要利用底层数据的结构,结合先验知识来生成更丰富的合成样本。这是一种有效的训练范式,但它并不能解决我们所有的数据扩展需求。所以,我认为合成数据是世界级后期训练的一部分,但并不是AI扩展的全部解决方案。
观众问题:为什么你选择从大企业客户入手,而不是从中小型企业开始?对想专注于企业的创业者有什么建议吗?
Alexandr Wang:大企业客户的主要挑战在于复杂性。大型企业内部常常有层层官僚机构,你需要学会如何清除这些障碍。如果成功了,企业客户的回报会非常可观。但与中小型企业相比,大企业客户的合作难度更高,因为你需要花费大量时间应对复杂的组织结构。
对于初创企业来说,如果你想快速起步,中小型企业确实是更显而易见的路径。它们的决策更快,执行起来更简单。但如果你选择专注于大企业客户,就需要做好面对复杂官僚流程的准备,同时在竞争中找到自己的独特定位。
Aditya Agarwal:非常感谢,Alex,今天与你的交流非常精彩!
Alexandr Wang:谢谢大家!
原视频:Alexandr Wang,Scale AI,& the Startup Hunger Games
https://www.youtube.com/watch?v=CEebe451GZs&t=11s
编译:David
(文:Z Potentials)