Anthropic CEO 专访:Claude 2025 新功能全剧透,不会推出单一的推理模型

许久没出现的 Anthropic CEO Dario Amodei 最近接受了华尔街日报的采访,对于 Claude 2025 年的功能规划、Agnet 和 o1 等思考模型,聊了很多。在他看来,思考模型和普通模型可能本来就不应该是分开的。

文章基于公众号「瓜哥 AI 新知」的编译,Founder Park 做了调整。

一些有意思的点:

  • 即将上线的功能: 网络访问(很快推出,优先考虑消费者端高级用户)、语音模式(双向音频,最终会实现,但目前企业端应用较少)、记忆功能(虚拟合作者愿景的一部分,很快推出)。照片生成功能则暂不优先考虑,可能通过与其他公司合作实现。
  • 即将发布更优秀的模型,将强化学习更广泛地应用于模型训练,使模型更具备思考和反思能力,从而更流畅地进行推理。 对「推理模型」的理解与其他公司不同,认为其并非完全不同的方法,而是一种涌现特性。
  • Claude 的个性化设计对企业端(例如客户服务)和消费者端都非常重要,其目标是成为一个高效、富有成效的长期助手,而非像社交媒体一样带来短暂的兴奋感。
  • 我认为在我们的领域中经常出现一些术语,但它们实际上并没有什么意义。「智能体」就是一个。「AGI」也是。「ASI」也是。「推理」也是。
  • 即使机器完成了你 90% 的工作,发生的事情是剩下的 10% 会得到超级杠杆作用。你把所有时间都花在这 10% 上。你在这 10% 上完成的工作量是之前的十倍,因为其他的 90% 实现了自动化。这对人类来说是有益的。
  • 我们应该开始考虑智力的边际回报,因为有些任务是智力可以帮助解决的,而另一些任务则存在某种物理限制或社会限制,智力无法帮助解决。
  • 批判性思维能力将非常重要,我们可以使用 AI 来增强这些批判性思维能力,而不是让它进一步腐蚀人类生态系统。

点击关注,每天更新深度 AI 行业洞察

01 

下一步是互联网访问和语音模式,

不会做图片生成

WSJ:首先,要表示感谢,我用 Claude 构建了一个达沃斯助手。我的意思是,我的老板们应该感谢你。它不会有倒时差的问题,我们也不必为它支付住宿费用,而且它对我的帮助非常大。它有我的日程表、笔记等等,但它也存在一些不足,我想探讨一些产品方面的问题。

所以我想列举一些我想要的功能,你们可以决定是否要告诉我确切的时间,或者告诉我它是否即将推出。首先是网络访问。

Dario Amodei:网络访问是我们正在努力的方向,而且很快就会实现。

我想让大家了解的是,Anthropic 的大部分业务都集中在企业级客户上,所以通常企业级客户的需求会被优先考虑。互联网访问更多地是面向消费者的一面,但我们已经研究了一段时间。我们有一些想法,我们认为这些想法与其他模型提供商的做法不同,所以,我不会给出确切的时间。但这很快会推出。我们理解它对消费者,特别是对消费者方面的深度用户的重要性,所以我们实际上正在优先考虑它。

WSJ:太棒了。好的,第二个是语音模式,一种可以和我对话的语音模式。

Dario Amodei:语音模式。我可以和它对话,它也可以回应我。我认为这最终会实现。我们的意思是,目前,Claude 可以转录你的语音,也可以朗读内容。但这种双向音频模式,是我们会在某个时间点实现的功能。但同样,在企业端和一些高级用户的应用较少。所以最终会实现的。

WSJ:还有照片,比如说图片生成。

Dario Amodei:是的,我一直认为图像或视频的生成与生成式 AI 中的许多其他内容有些不同。如果你想想人类的行为,人类会摄取音频、照片和视频,但他们实际上并不能轻易制作照片。我的意思是,有画家,但他们不能轻易制作照片。我一直认为这有些不同。而且我认为在安全方面,图像生成和视频生成有一些与文本生成无关的独特问题。

此外,我认为这些功能在企业中的应用案例并不多。所以我们通常不打算优先考虑这个领域。如果它在消费者方面变得重要,我们可能会简单地与专门从事这方面工作的公司合作。

WSJ:这很合理。我还在 Twitter 或 X(现在叫什么都无所谓了)上问过这个问题,我得到了 200 多个回复,但大多数人都在要求提高速率限制。

Dario Amodei:是的。我们正在努力解决这个问题。

发生的情况是,过去一年,尤其是过去三个月里,需求的激增已经超出了我们提供所需计算能力的能力。如果你想购买大量的计算能力,需要一定的提前时间。我们的收入在过去一年里增长了大约 10 倍,从大约 1 亿美元左右的规模增长到 10 亿美元左右,而且增长势头没有减缓。

所以我们正在尽可能快地提高效率。正如我们在亚马逊的大会上宣布的那样,我们将拥有一个由数十万个 Tranium 2 芯片组成的集群。我毫不怀疑,到 2026 年,我们将拥有超过一百万个某种类型的芯片。所以我们正在努力将这些芯片上线,并使其推理尽可能高效,但这需要时间。

我们已经看到了需求的巨大激增,我们正在努力满足所有这些需求。可能甚至对于现在付费的用户来说,体验也会变得更好。

WSJ:最后,一个记忆功能,让 Claude 记住事情,不仅在项目中,而且可以跨项目记住。

Dario Amodei:是的,这非常重要。我认为,这是我们更广泛的愿景的一部分,我们称之为虚拟合作者。你知道,我认为这很重要的一部分是,当你与同事交谈时,你的同事需要记住你们以前进行过的对话。所以这非常重要,而且很快就会实现。


02

推理模型和普通模型,

可以是一个模型

WSJ:你之前提到你们非常专注于企业市场,但作为消费者,我的意思是,我们所有人,即使是在公司工作,也都是消费者,Claude 的性格非常吸引人。这使得它非常有用,而且我发现我自己会选择 Claude 而不是其他的 LLM 或产品。你是如何看待这一点的呢?我的意思是,你设计了这个性格,你设计了一个在企业中工作的性格。那么消费者呢?

Dario Amodei:是的。实际上,我认为 Claude 的角色在两方面都很重要,对吧?因为它显然对与之互动的消费者非常重要。我认为它在企业方面也很重要,因为我们服务于 Intercom 等许多公司,这些公司提供客户服务。因此,该模型随后用于客户服务,并且那里的交互模式也很重要。

即使是像编码这样的应用程序,角色也很重要。斯坦福医学院上周刚刚进行了一项研究,他们比较了 Claude 和其他模型在放射影像分析等方面的准确性,以及医生采用模型建议的程度。他们发现,医生实际上更倾向于倾听 Claude 并采纳其建议。我认为这与他们与之互动的方式有关。

所以我认为,在企业和消费者方面,我们都付出了很多努力,以确保与 Claude 的互动是良好的、真实的体验。我认为我们之所以投入这么多精力,是因为我们认为它在世界上具有更大的意义。在这个世界里,个人消费者,尤其是为了提高生产力,会与模型进行互动。他们每天可能会与模型互动几个小时,将模型视为助手。或者在工作中,你会把它们当作非常聪明的助手,它们可能解决数学问题的能力比你强得多。

这种紧密的结合是我们需要正确处理的事情。这不仅仅意味着要有趣和友好。这意味着模型需要以一种方式与你互动,让你在与模型互动几个月甚至几年后,当它成为你工作流程的一部分时,你实际上会变得更好。你会变得更高效,你会学到东西,当然,模型会为你完成工作,帮助你完成工作,但从长远来看,这种关系必须是富有成效的。

我认为社交媒体在这方面的情况并不理想,对吧?社交媒体最大的问题是它非常引人入胜;它会给你带来快速的兴奋感。然而,我认为我们都怀疑,从长远来看,它正在对人们造成某种不健康的损害。我真正地记住了这一教训,并且我想确保人工智能不会像那样。我认为,Claude 的角色是其中最重要的一环。

WSJ:你刚才提到了模型,你们有一大批高级用户,所以很多人都在关注你们的下一代模型。是的,OpenAI显然已经推出了这些新的推理模型,o1、o3。你们的计划是什么?

Dario Amodei:是的,我认为在不久的将来,我们将发布一些非常优秀的模型。我不会具体说明名称。关于推理模型,我们的观点实际上有点不同。一直以来都存在推理模型和测试时计算的问题,好像有普通模型和推理模型之分,它们是完全不同的做事方式。但这不是我们的观点。

我们更将其视为一个连续的谱系,模型具有思考、反思自身思考并在最终产生结果的能力。如果你已经使用 Sonnet 3.5,有时它会在某种程度上做到这一点。然而,我认为我们将看到的变化是,我们将看到更大规模地使用强化学习。当你用强化学习训练模型时,它就开始更多地思考和反思了。

推理或测试时计算,无论它被称为什么,都不是一种全新的方法。它更像是一种涌现的属性,是更大规模地以结果为基础训练模型的后果。

我们可能仍然需要看看它是如何工作的,它会如何发展。我认为它会在两者之间更连续地进行插值,它会更流畅地将推理与模型所做的其他所有事情结合起来。我认为这将是最有效的方法。

正如你所说,我们经常专注于确保使用模型是一种流畅的体验,以便人们能够充分利用它。我相信对于推理模型,我们将采取类似的方法,并可能做一些与其他人使用推理模型不同的尝试。

WSJ:好的,没有确切的日期,但我们听到的是在不久的将来。那么在你看来,那是像 6 个月,还是像 3 个月?

Dario Amodei:在 3 到 6 个月之间。

WSJ:我们本周听到一些报道,OpenAI拥有一个博士级别的代理。这些东西真的发展得这么快吗?

Dario Amodei:呃,是的。

如果我们回到 2018 年、2017 年,在我第一次进入这个领域几年后,我当时的观点是,你知道,我和我在 Anthropic 的联合创始人一起,是第一个记录 Scaling law 的人,它表明你向这些模型投入更多计算资源,它们在各方面都会变得更好,真的是各方面。从那时到六个月前,我的观点是,根据这些趋势,我怀疑我们将获得比几乎所有人类在几乎所有方面都更好的模型。我认为这将会在 2020 年代发生,可能是 2020 年代中期。但我总是这么说,我不知道。我不确定。就像,我们可能是错的。我认为这是应该有的正确态度。就像,你知道的,尤其是当你是一家此类公司的首席执行官时。

直到大约三到六个月前,我对此仍然存在很大的不确定性。我现在仍然存在不确定性,但这不确定性大大减少了。我认为在未来 2 到 3 年内,我相对有信心我们将看到在工作场所出现、被消费者使用的模型,它们是人类的助手,但它们会逐渐在几乎所有事情上比我们做得更好,而且积极的后果将会是巨大的。消极的后果,我们也必须警惕。我认为进展真的像人们想象的那么快。

我要批评的一点是,我认为现在非常重要的是,快速的进展相对来说是很有可能发生的,我们需要以适当的严肃态度对待它,并认真地讨论它。其他一些公司,我不会点名,只是有这些奇怪的 Twitter 谣言,比如员工谈论。我认为这很危险,因为外部的人会认为,哦,这只是炒作。这种沟通方式给人一种印象,好像这件事并不严重。

我认为这在它实际上很严重的情况下是非常危险的。我认为整个AI行业实际上有义务指出我们所处时刻的严肃性。如果我们真的在说存在令人难以置信的积极可能性,那么任何如此大的变化都不可避免地存在风险。我们有义务认真地沟通这件事,并说出我们真正的想法。


03 

未来AI 会颠覆

通过劳动来分配价值的观念

WSJ:我想回到你刚才说的关于同事和所有讨论的事情。他们应该把达沃斯改名为「智能体狂欢节」。每个人都在谈论他们拥有代理,代理即将到来。你称之为虚拟合作者。你们对此有不同的说法。

你们的智能体或虚拟合作者进展如何?我们在去年年底看到了一些 Computer Use 的迹象。给我们一个简短的路线图。

Dario Amodei:可以消除很多炒作。首先,我应该先澄清一下。我认为在我们的领域中经常出现一些术语,但它们实际上并没有什么意义。「智能体」就是一个。「AGI」也是。「ASI」也是。「推理」也是。如果你在外面,它们听起来像是有什么意义,但它们没有精确的技术含义。

因此,「智能体」的用途,你知道的,比如,我按下这个 AI 系统的按钮,它就会为我编写一个完整的应用程序,然后创立一家公司或其他什么。我认为我们想到的更接近第二种情况。我们版本的这是虚拟合作者(虚拟同事)。

你提到了计算机使用。计算机使用可能是它的早期体现;它是其中一种成分。但我认为我们想到的是,你工作场所的助手或你个人使用的助手。有一个模型能够在电脑屏幕上做任何虚拟人能够做的事情。

你与它交谈,你给它一个任务,也许这是一个它需要一天才能完成的任务。例如,你可能会说:「我们要实现这个产品功能」,这需要编写一些代码,测试这些代码,将其部署到某些测试环境中,与同事交谈,编写设计文档,创建谷歌文档,发送 Slack 消息以及向人们发送电子邮件。

就像一个人一样,模型会去做这些事情,然后每隔一段时间就会向你汇报。所以,我会把它看作一个智能体。我认为它是一个在很长一段时间内代表你行动的自主虚拟合作者,你定期与它核对。你可以认为它拥有虚拟运行的人的所有管道和所有输入和输出。

WSJ:那么,这方面的时间规划是怎样的?

Dario Amodei:我怀疑,我的意思是,你永远无法确定这些事情。研究过程难以预测。我无法确定我们自身将会发生什么,也无法确定行业将会发生什么。但我确实怀疑,今年将会出现这些能力的强力版本。而且可能就在今年上半年。

WSJ:让我们谈谈房间里的大象,或者说「智能体」,这将会影响人类的工作,对吧?

Dario Amodei:是的。我通常将这个问题分为短期和长期。

短期内,我们过去多次经历过技术对劳动力的冲击。我认为在短期内(在我的时间压缩世界里,短期可能是 1 年或 2 年,或者可能是 3 年),在这个时间尺度上,我不会说我们有完美的解决方案,但我们以前也经历过技术对劳动的冲击。重要的是要考虑工人的适应能力,并利用比较优势。

比较优势是显著的。即使机器完成了你 90% 的工作,发生的事情是剩下的 10% 会得到超级杠杆作用。你把所有时间都花在这 10% 上。你在这 10% 上完成的工作量是之前的十倍,因为其他的 90% 实现了自动化。这对人类来说是有益的。你也可以学习如何围绕机器的工作来调整你的工作。因此,我们也可以从产品的角度考虑如何设计我们的产品,以实现互补而不是替代。

经济学家 Erik Brynjolfsson 大约在一年前做了一项有趣的研究,该研究表明,默认情况下,当公司部署 AI 时,他们倾向于以替代模式部署。但是,当他们更多地思考时,当他们更多地关注部署时,他们通常会找到以互补模式部署的方法。当他们这样做时,生产率的提高会更大,这表明存在某种路径依赖。存在不同的部署技术的方式,我们在设计虚拟协作者时也在考虑这一点。

我必须承认这里存在一个残酷的有效市场。如果以互补的方式做事会可靠地被不以互补方式做事的方式在市场上击败,那么整个行业都会处于困境,我们必须思考如何解决这个问题。因此,必须考虑如何驾驭这些市场力量,以一种有利于行业和人类发展,同时保持竞争力的方式进行创新。

从长远来看,我认为我不知道这具体会在什么时候到来——我不知道是否会是 2027 年,但也有可能比这更久。我相信人工智能系统最终会在几乎所有方面都超过人类,最终在所有领域都超越所有人类,包括机器人技术。一旦我们创造出足够先进的人工智能系统,它们也将帮助我们开发更好的机器人。当达到这一点时,我们需要在这样的活动上讨论如何组织我们的经济以及人类如何在工作中找到意义。

我们对人类智力优势所做的许多假设都将被人工智能的进步所推翻。如果我们最终都面临同样的境况,我会感到稍微轻松一些,尽管这不会容易。我的担忧在于,30% 的人类劳动被人工智能完全自动化,而剩下的 70% 则为生存而挣扎。这可能导致受影响者和未受影响者之间的对立。然而,如果我们都在同一条船上,我们就可以团结起来承认,我们已经达到了一个拥有巨大财富和经济价值的点。这一认识将迫使我们重新思考如何分配这些价值以及传统的经济劳动与人类自我价值之间的联系。

一旦劳动对我们自我价值观的意义被否定,我们就需要共同寻找解决方案。我真诚地相信,这一现实就在眼前。人工智能公司将成为这场讨论的中心,或者甚至因为这场讨论而面临挑战,我们必须共同承担起寻找答案的责任。


04 

靠自己的价值观吸引优秀人才

WSJ:现在AI行业正在争夺人才,对吧?你有OpenAI、Meta 以及所有其他竞争对手。你如何考虑吸引最优秀的人才加入 Anthropic?

Dario Amodei:我想提两点。

第一点是,我在播客里也说过,我对人才的理念是,人才密度总是胜过人才总量。你想要的是一个相对较小的人才群体,你招聘的几乎每个人都非常优秀。即使其他公司规模大十倍,拥有优秀人才的数量是我们的两倍,但优秀人才彼此合作之间存在某种魔力,某种神奇的化学反应。当你招聘工程师或研究人员时,他们环顾四周,看到每个人都像他们一样才华横溢。这始终是我们的理念。这就是我认为人才蜂拥而至 Anthropic 的原因。

第二点是价值观以及对这些价值观的诚实表达。从一开始,正确处理安全和社会问题对我们来说非常重要。我认为这个领域有许多公司承认这些问题很重要,甚至为此做了一些具体的努力,我为此赞扬他们。然而,随着时间的推移,特别是自从我和我的联合创始人离开我之前的雇主之后,随着我们选择自己的方式,而其他人采取了不同的方法,差异开始显现出来。

你会看到公司做出承诺,你会看到这些承诺如何随着时间的推移而兑现。你会看到他们内部员工如何看待他们做出的承诺,对吧?有些事情不会公开,但你会从他们的行动中,从人们如何用脚投票中看到,我认为这一点非常重要。我认为,真正践行这些价值观,使其具有实质性而不是仅仅是营销活动,这一点非常重要。而且我认为,在这些公司内部的许多人才都认识到并理解这一点。而且我认为,人才的流向可以表明谁是真正真诚的,我对此持乐观态度。

WSJ:最近,亚马逊最近给你开了一张 40 亿美元的支票。你筹集了更多资金。我相信,我们报道的是 20 亿美元。你能为我们确认一下吗?

Dario Amodei:我不能确认任何关于正在进行的融资的细节,但是如果你把我们已经筹集或报告筹集的所有资金加起来,肯定远超百亿美元。

WSJ:只是想从宏观角度来看,你是如何与这些科技巨头共舞的?是他们在领导,还是你在领导?

Dario Amodei:我认为,一方面,这些合作关系很有意义,因为我们需要大量的计算能力,而且训练这些模型需要大量的先期资本。这些模型被部署时,通常会部署在云端,因为你可以在那里提供安全标准。所以从经济上讲,这种合作关系很有道理。

但在另一方面,我们的独立性对我们来说也非常重要。这就是为什么我们与多家云合作伙伴合作的原因。例如,我们与亚马逊合作,也与谷歌合作。每次我们与其中一家云合作伙伴签署合同时,我们都会确保我们承诺的某些内容,例如我们的「负责任的扩展政策」,该政策会管理我们如何测试、处理和为我们构建的每个新模型提供安全性。

每次我们与这些云合作伙伴合作,每次签署新协议时,我们都会确保我们在云端部署这些模型的方式与我们的负责任扩展政策一致,事实上,这已经产生了连锁效应,对我们政策的了解和教育鼓励一些云厂商也加快了类似政策的采用。

这是一个我所说的「向上的竞争」的例子,即树立榜样,其他参与者也可能效仿并做出一些好事。


05 

大学生:学习 AI,

培养自己的批判性思维

WSJ:你刚才说,这在 Anthropic 只占用一天的时间。你们是这样看待事情的吗?

Dario Amodei:我的意思是,你知道,这是否像是 Claude 一天的工作,随着 Claude 做得越来越多,或者帮助人们做更多的事情?我们正在考虑人与 AI 模型的相互补充,并以各种方式互补。有一定的计算量,也有一定的人员。我认为整个经济体都必须开始以这种方式思考。

在我的文章《爱的恩典机器》中,我使用了这个词语——智力的边际回报,对吧?经济学家谈论的是土地、劳动力、资本、技术等的边际回报。我认为我们应该开始考虑智力的边际回报,因为有些任务是智力可以帮助解决的,而另一些任务则存在某种物理限制或社会限制,智力无法帮助解决。

因此,我认为这种思维方式在 Anthropic 内部正变得越来越普遍,也应该在全世界范围内变得越来越普遍。

WSJ:最后一个问题,我们一直在讨论人工智能进入劳动力市场。对于一个即将在人工智能时代开始职业生涯的年轻人,或者更早的时候,比如高中生、大学生,你最好的建议是什么?

Dario Amodei:一,我认为很明显,要学习使用这项技术,这是显而易见的。它的变化非常快,而且我认为那些能够跟上时代步伐的人,处境会比那些不能跟上时代步伐的人好得多。

我的第二个建议是,我认为最重要的是培养批判性思维能力,一种批判性思考能力。学习批判性地看待你看到的信息。现在,AI 系统能够生成非常合理的解释、非常合理的图像、非常合理的视频,我认为信息生态系统在某种程度上已经完全被打乱或颠倒了。你必须非常努力地尝试才能知道什么是真的,什么不是真的。事实是,它已经从一个精选的环境变成了一个更加野蛮的环境,而且我担心 AI 的某些方面可能会使情况变得更糟。所以,当你看到某些东西时,要问:这合理吗?这真的可能吗?我不知道,你只是在 X 或 Twitter 上看到所有这些东西,然后有 10 万人点赞,你看了一下,觉得这根本没道理,这完全没道理。

以前那种经过精心策划的世界已经消失了。所以,我们必须以某种方式使这个新世界,这个市场实际上运作起来,并以某种方式趋向于真实。我认为批判性思维能力将非常重要,我们可以使用 AI 来增强这些批判性思维能力,而不是让它进一步腐蚀生态系统。

参考资料: https://www.youtube.com/watch?v=snkOMOjiVOk




(文:Founder Park)

欢迎分享

发表评论