
在 Meta Platforms 与 Scale AI 达成交易后,数据标注正成为硅谷新的热门领域。这对 Edwin Chen 创立的 Surge AI 而言意味着巨大机遇。
• Surge AI 的规模超越了 Meta Platforms 近期估值近 290 亿美元的 Scale AI。
• Surge AI 成立五年未融资,2024年营收10亿美元(超越Scale AI的8.7亿),以110人团队实现Scale三倍人效。
• Surge 创始人 Edwin Chen 将这家初创企业定位为其他数据标注公司的高端替代选择。
多年来,数据标注一直隐藏在硅谷的角落,这个对 AI 至关重要却缺乏光环的领域里,谷歌和 OpenAI 等公司通过外包企业对其产出进行繁琐的质量评级来优化模型。
随着 Meta Platforms 决定以 143 亿美元收购数据标注行业最知名的 Scale AI 公司 49%股份,这个领域意外地站到了聚光灯下。但它并非该领域规模最大的公司,或许也称不上最令人瞩目。这一头衔属于由Edwin Chen 创立的 Surge AI。
陈的初创公司通过承诺将客户的人工智能训练至最高标准,赢得了谷歌、OpenAI 和 Anthropic 等客户。他为自己公司的工作设定了崇高目标:开发具有真正“创造力和偶然性“的人工智能。在他理想的世界里,一个模型能够根据要求创作一首关于月亮的八行诗,并写出“让人感动落泪“的作品。
37 岁的陈没有接受任何投资,完全依靠自力更生运营这家成立五年的初创公司。该公司拥有 110 名员工,在纽约和旧金山设有办公室。
据 Surge 向员工透露,公司去年营收超过 10 亿美元——这一此前未公开的数字超过了 Scale 同期 8.7 亿美元的营收。与 Scale 不同,陈表示 Surge 从一开始就实现了盈利。(此外,如果其他公司效仿 OpenAI 停止雇佣 Scale 的决定,这一选择源于对 Scale 与 Meta 关系的担忧,并将业务转向 Surge,其销售额可能会进一步增长。)
其他关键财务指标尚不明确,例如Surge 在支付主要由合同工组成的员工队伍后能保留多少收入。(大多数类似公司如 Scale 会将约半数收入支付给合同工。)但如果 Surge 能获得与 Meta 给予 Scale 相当的投资者估值,这样的价格将使陈成为身价数十亿的富豪(至少在账面上),并悄然跻身科技界最富有的人群之列。
随着AI 模型从玩具转变为真正的商业工具,数据标注正变得越来越重要。Surge 等公司雇佣的合同工负责对 AI 模型的响应进行评级,并在编程、数学和法律等领域编写成千上万的问题与答案来喂养这些 AI 模型——本质上是在教会它们什么是优质回答。Surge 子公司 Data Annotation Tech 表示,工人可以“按照自己的时间安排通过训练 AI 获取报酬“, 根据公司官网显示 ,时薪起价为 20 美元。
陈通过将Surge 定位为高端服务商而使其脱颖而出,收取的溢价费率通常是 Scale 报价的 2 到 5 倍。Surge 凭借其行业领先的工作质量证明高价的合理性。事实上,一位 Scale 前员工透露,在客户对标注质量的审核中,Surge 的表现往往优于 Scale。竞争对手 Garrett Lord(其运营的 Handshake 公司获得凯鹏华盈投资)也坦承陈是“该领域无可争议的第一人“。
从Meta 轰动性准收购 Scale AI 的报道中,你完全看不出这点。Scale CEO Alexandr Wang(即将出任 Meta 高级 AI 职位)被普遍视为数据标注领域的领军人物,已成为硅谷名人——高频现身播客和会议,并在 X 平台保持活跃更新。他还筹集了 15 亿美元风投资金,使 Scale 跻身融资规模最大的极少数公司之列,并组建了超千人的团队。
考虑到Surge 的发展势头,王可能选择了一个完美的退出时机。这家公司在没有外部资金支持、员工规模仅为 Scale 一小部分的情况下,已经发展得比 Scale 更为庞大。Scale 去年还未能实现 10 亿美元营收目标。(Scale 发言人 Joe Osborne 表示公司对自身业绩记录充满信心,并补充道:“我们认为 Scale 让更多此前名不见经传的公司获得关注是件好事。“)
一位曾雇佣过 Surge 的大型科技公司高管形容该公司“好得令人放心——他们就是能把工作做好“。这位客户补充道:“我完全不用担心在新闻头条上看到 Edwin 的名字。“
但 Surge 及其竞争对手有时确实会引发负面新闻。例如上个月,Surge 在加州遭遇一起集体诉讼 ,指控这家初创公司之所以能发展到如此大规模并实现盈利,部分原因在于其违法行为。由部分 Surge 承包商提起的诉讼称,该公司将员工错误归类为承包商,并且不支付某些必要工作的报酬,如培训课程和为确保工作质量而参加的资格认证考试。Scale 和其他数据标注公司也曾面临类似诉讼。
代表原告方参与诉讼的Clarkson 律师事务所合伙人 Glenn Danas,将这家 AI 初创公司的工作环境描述为“反乌托邦式“。Surge 公司发言人则称该诉讼“毫无根据“。
陈表示,许多合同工——尤其是拥有博士和硕士学位的人——经常选择回归 Surge 而非其他竞争对手,因为它能提供他们想要的东西:与其多年钻研领域相关的稳定项目流。“这几乎就像在教导 AI 时,你终于能真正实践毕生所学,“他说道。
陈先生在麻省理工学院学习语言学与数学,毕业后因亲眼目睹大型企业在数据处理方面的困境,萌生了创业想法。
在创立Surge 之前,陈曾在 Facebook、Dropbox、Google 和 Twitter 担任机器学习工程师,负责开发推荐和搜索算法,并协助收集训练这些算法所需的数据。
尽管这些公司资源雄厚,陈却遇到了诸多难题。例如在Facebook 时,他负责协助打造一个对标 Yelp 的竞品。他的团队需要训练一个能正确分类商业实体的模型——比如区分餐厅和杂货店。为此他们需要包含 5 万家精准标注商户的数据集,而他发现外包公司需要六个月才能完成这项数据整理工作。
“除了等待,我们别无选择,”陈说。“所以我们只能等。”当数据返回时,陈的脸色变得苍白。在某些情况下,它把餐馆标记为咖啡店,把咖啡店标记为医院。“这些数据完全就是垃圾。”(他拒绝透露 Facebook 使用了哪家供应商的服务。)
2020 年,他离开 Twitter 创立了 Surge,并以只有旧金山创业者才有的方式获得了首批客户——来自 Airbnb 和曾颇具前景的 AI 搜索引擎初创公司 Neeva 的高管:在城市 Dogpatch 社区和 Mission District 的攀岩馆偶遇他们,并向他们推销自己的初创公司。
为了让 Surge 起步,陈招募了他在之前工作中认识的数据标注承包商,并用自己的积蓄为初创公司提供资金。(他拒绝透露具体投入金额。)幸运的是,陈专注于语言模型。相比之下,Scale 最初是为自动驾驶汽车评估更多视觉数据——而就在那时,这类模型开始变得越来越重要。
不到一年后,OpenAI 就聘请了 Surge 来微调其模型,根据双方联合发表的研究论文,教导模型如何避免产生有害回应(如种族歧视性语言)。到 2022 年,Anthropic 也成为了 Surge 的客户。该公司部分依赖 Surge 的承包商来评估大型语言模型能否帮助人类监控其他 AI 系统——在全行业竞相开发类人 AI 的浪潮中,这成为了一项安全校验措施。
数据标注还能确保模型输出的风格一致性。据一位参与该流程的人士透露,某企业科技公司曾聘请 Surge 的合同工编写代码行及其配套说明。这些代码和说明不仅需要准确无误,还要求不同标注人员提供的示例在结构、长度和复杂度上保持相似,从而确保公司训练的模型能输出符合其风格的代码。
客户表示,Surge 对其内部流程及如何能如此快速生成高质量数据讳莫如深。但他们也指出,这种情况并不罕见。
“这和我与云服务提供商合作时的情况一样,”这位企业技术客户说道。“我不知道他们服务如此出色的内部原因。我只需按下一个按钮,就很感激那些让这一切实现的幕后工作。”
数据标注公司通常采用多种技术手段确保外包人员不会在回答问题时刻意敷衍。例如,这些公司会随机插入没有标准答案的问题,或是要求多名标注者对同一问题的正确答案达成共识。
对外包人员的筛选同样至关重要,尤其是随着模型开发者越来越需要受过高等教育的外包人员来编写计算生物学、理论物理学等前沿领域的问题与答案范例。
陈先生不愿详述公司如何管理标注者回答质量的具体方法,但他表示Surge 会在初步筛选后持续评估外包人员。他指出公司能通过多种信号判断回答质量,例如外包人员使用的措辞或光标移动轨迹。
Meta 同样在 Surge 上投入了大量资金,尽管在投资 Scale 之前也与其有业务往来。据一位直接了解数据的人士透露,去年 Meta 的生成式 AI 团队向 Surge 支付了超过 1.5 亿美元用于数据标注工作,这家初创公司将全程管理整个流程。该人士表示,这与 Scale 获得的约 2 亿美元相差并不太远。
尽管Surge 近期确实发展迅猛 ,但除了数据标注行业普遍存在的诉讼问题外,它还面临着诸多障碍。
首先是潜在的法律纠纷,比如工人诉讼案。代理起诉Surge 和 Scale 的律师达纳斯将这种情况比作上个十年网约车公司与工人之间长达数年的法律斗争。
部分客户还抱怨 Surge 经常预约爆满,且承接项目需要数百万美元的投入承诺。与此同时,包括 OpenAI 在内的模型开发商越来越多地通过 Mercor 等招聘机构自行寻找承包商来完成标注工作。
如今可供选择的数据标注公司更多了,这可能会对价格形成下行压力。例如,据谷歌前人工智能技术主管透露,虽然谷歌长期是Surge 的客户,但为了规避供应商锁定风险,已逐渐与更多服务商展开合作,并成功与 Surge 协商获得了更低的价格。
AI 开发者还发现了无需人工参与的更廉价模型优化方法,例如蒸馏技术 ——通过高级模型的输出结果来提升小型模型性能的过程。
陈先生对一些关于其企业能否保持快速增长势头的担忧不以为然,坚称公众尚未真正理解Surge 的业务模式——他认为维持质量标准实际上比人们想象的要困难得多。
人们总是严重低估这个领域的难度,“他表示,“他们认为人类很聪明,普通博士也很聪明,所以随便找10万人放手干就行。但我们发现事实完全不是这样。
参考资料
编译:ChatGPT
(文:Z Potentials)