独家｜专访吴承霖，PH周榜冠军Coding Agents完成亿元融资，零推广月收百万美金，开源OpenManus

DeepWisdom完成亿元级融资，旗下智能体产品mgx.dev以零推广首月狂揽百万美元ARR，连续四周霸榜Product Hunt全球榜首。它让普通人也能一句话做出自己的APP。其独创的类人类社会的多智能体结构，让智能体自发组织，完成从调研、设计、开发到部署的全流程。他们团队打造了 MGX（MetaGPT X）、MetaGPT、OpenManus 等一系列爆款工作，开源 star 数总共超过了 13 万。DeepWisdom正在进行新一轮融资，星涵资本担任独家财务顾问。

本期我们有幸邀请到了 MetaGPT 的创始人吴承霖。MetaGPT 作为智能体协作领域的开源标杆，以“SOP”理念推动 AI Agent 从代码生成走向全生命周期管理，其开源的 OpenManus 平台更以成功实现“Manus”的功能并开源而引发热议。在这场对话中，我们一同探讨了吴承霖如何做出了这些拥有巨大影响力的开源工程、开源社区如何重构软件开发生产关系、MGX 如何用自然语言编程带来新的编程范式，以及学术循环等核心议题。让我们一起走进此次对话！

我们的目标是自然语言编程。MGX 就是 MetaGPT X，核心在于解决 MetaGPT 的产品化问题。

我们已推出的产品 MGX 目前 ARR 增长速度可能是中国历史最快的，没有花费任何宣传费用。

OpenManus的核心开发者仅是 4 名本科毕业不到一年的年轻人在 3 小时打造的……根本原因在于他们所处的环境具备良好的学术循环。学术循环使得组织内的每个人都能撬动更大的杠杆，创造卓越的成果。

人类究竟在做什么？我们做所有事情究竟有什么意义？我们都没有找到一个真正的解——我们并不清楚数学和物理背后是什么……所以我想，做什么能让我更接近世界背后的本质？答案或许是做出解决问题的机器。

我的体会是，有些结果听起来很难想象的事情其实可以实现，但必须知道精确的路径，以特定方式完成……

开源是文明最大的杠杆，推动着技术进步与社会变革。开源本质上是对全人类的知识共享，推动文明的进步。

许多突破并非源自单一的重大创新，而是由持续的增量改进组成。无论是 OpenAI、早期的字节跳动，还是 DeepSeek，它们的成功都符合“学术循环”的逻辑。

学术循环的逻辑核心在于：组织内的每个人都能持续贡献原子化的增量内容，推动组织整体进步。

学术循环不仅依赖于个体的能力，更取决于团队文化的塑造和执行机制的完善。
短期来看，AI 更可能影响特定职业，比如数据分析师、前端工程师，而大型软件公司不会受到颠覆性冲击。软件工程仍然会存在，只是工具、形式以及操控它的人会发生变化。

01 从寻求答案出发：打造解决问题的机器

ZP：可以请您先介绍一下自己的背景，请您先从求学时的经历开始？

吴承霖：高中时我一直在考虑读哲学系，当时我会拷问自己：我们究竟在做什么？我们做的所有事情究竟有什么意义？当时我认为即使我掌握了更多知识，整个世界也不会产生任何的变化。包括数学、物理在内的现代科学，对于世界上的问题都没有找到一个真正的解——我们并不清楚数学和物理背后是什么。

我看了很多哲学相关的书，也追溯到了形而上学。在看了很多相关内容以后，我发现包括形而上学在内，它们都只有理论，而理论并不解决问题。

所以我想，做什么能让我更接近世界背后的本质？答案或许是做出解决问题的机器，所以我报了计算机系。

2008 年的时候我刚上大学，计算机处于退潮时期，PC 互联网基本饱和， iPhone 刚刚发布，安卓出世，移动互联网刚开始发展。在大学期间，我学了很多 coding 知识，也系统性地学了神经网络 40 多个不同的变种，大部分是模仿人脑的。

同时我看了接近 100 本金融和机器学习相关的书籍。那时候最喜欢的一本书是Tom Mitchell （CMU 计算机系的创始人）的《Machine learning》。当时我已经完成了对行业历史的浏览，大概知道了过去 50 年左右大家都在做什么。我认为股票更多的是由特征决定的（也被称为因子），同时我实现了几十种神经网络，手动做了 100 多个特征，这些特征之间能完成基础的组合，并且我套了一个遗传算法去完成它们之间的自动优化和调参，自动找到这些特征和网络之间最佳的组合。可以认为这个是用自动机器学习做金融交易机器人的一个最早的实践，我也通过这个研究，在大学阶段就自力更生，毕业后的第一台笔记本电脑也是我用自己赚的钱买的。

但我还是会一直想，这究竟有什么意义？当时做自动机器学习，更多的是潜意识驱使我去做一个能做出 AI 的 AI。归根到底，我追求的是一个通用求解器，这个通用求解器能解决世界上的绝大部分问题。或许哲学和物理的问题都可以由这个通用求解器来回答。

ZP：那么您在毕业后又做了哪些尝试来寻找答案呢？

吴承霖：毕业后，我加入华为，并在短时间内取得了一些业绩贡献。一方面，我推动了部分核心产品的工作。在入职十个月后，我已经做出了大量的贡献，并且也带了一些人。另一方面，我为十几个不同的开源项目做出了贡献。其中，我贡献最多的项目是 Open vSwitch，其母公司 Nicira 被一位斯坦福大学教授打包出售，交易金额达 12.6 亿美元。

我也发起过一些非常疯狂的开源活动，其中有一个叫 Coding 马拉松，目标是在 365 天内每天编写 50 行有意义、不重复，并对社会有贡献的代码。活动初期吸引了大量报名者，但最终坚持完成的人仅有十几位。虽然大家都很勤奋，但更多是用精神在激励自己。

ZP：Coding 马拉松的活动有没有给您带来不一样的体会？

吴承霖：我的体会是，有些结果听起来很难想象的事情其实可以实现，但必须知道精确的路径，以特定方式完成。比如如果没有报酬，让一个人 365 天全年无休做一件事，乍看之下绝无可能；但如果换一种方法做（比如 coding 马拉松的形式），它却有可行性。通过这种坚持，在 2013 年的时候，我在一个开源的排行榜排到了前几名。

这段经历让我更加深刻的体会到开源的独特价值。过去几十年，人类社会的生产力发生了巨大变革，而其中最关键的推动力之一便是开源软件。软件精确而高效的共享了知识，提升了生产力，而开源加速了软件。从某种意义上来说，开源是世界上最大的杠杆，推动着技术进步与社会变革。开源本质上是对全人类的知识共享，推动文明的进步。虽然大多数人不会直接捐赠金钱，但仍有人愿意投入时间和精力，为社会创造真正有价值的贡献。尽管这些人往往不被注意，但他们的存在，正是推动世界前进的重要力量。

02 技术突破的核心：理解并建立学术循环

ZP：那么这些感悟是如何映射在您的价值观上呢？

吴承霖：许多突破并非源自单一的重大创新，而是由持续的增量改进组成。无论是 OpenAI、早期的字节跳动，还是 DeepSeek，它们的成功都符合“学术循环”的逻辑。

这种逻辑的核心在于：组织内的每个人都能持续贡献原子化的增量内容，推动项目或组织整体进步。这一模式极具挑战，而开源在某种程度上符合这一标准，因为全球开发者都可以监督、改进你的工作，使其既原子化（atomic），又可持续迭代（incremental）。然而，大多数公司很难真正做到这一点。

学术循环本质上由一系列小型、原子化的创新构成。而要形成学术循环，必须满足几个关键前提，主要包括三点：

a.批判性思维（Critical Thinking）——不仅要求个体具备批判性思维，整个组织也必须形成这种文化；

b.内在驱动力（Motivation）——组织成员需要有持续推动创新的动力；

c.适当的标准化流程（SOP）——确保创新能够高效执行与迭代。

这三者缺一不可，否则难以构建真正的学术循环。因此，无论在中国还是全球，能够形成学术循环的公司屈指可数。尤其是批判性思维和内在驱动力往往难以兼得——具备批判性思维的人通常极具聪慧，但动力未必足够强，而高度自驱的人又可能缺乏深入的批判性思考，两者形成某种此消彼长的平衡。

最近，我们的 OpenManus 受到了广泛关注，然而OpenManus的核心开发者仅是 4 名本科毕业不到一年的年轻人，包括两位非科班的成员。这一现象值得深思——他们的履历并不耀眼，但仍然取得了出色的成果，根本原因在于他们所处的环境具备良好的学术循环。学术循环使得组织内的每个人都能撬动更大的杠杆，创造卓越的成果。

学术循环的构建极具挑战性。 以一家互联网公司为例，即便招聘到四名优秀的本科生，大多数情况下，他们只会被安排处理数据等基础性工作，难以真正发挥潜力。因此，即使找到具备天赋的人才，也未必能塑造学术循环。我曾在组织内撰写了数十篇文章，探讨如何构建学术循环，包括 如何选人、如何建立认可机制 等，而这些都是极具挑战的课题。

在我们的组织架构中，层级高度扁平，每个人都有自由选择工作的权利。但正如前述，这一模式依赖于成员的高动机（motivation）。如果团队中个别人的动机不足，整个组织的运作便可能迅速失衡。因此，学术循环不仅依赖于个体的能力，更取决于团队文化的塑造和执行机制的完善。

这种团队文化高度依赖透明度，这与开源极为相似，因为开源本质上是一种完全透明的协作方式。我一直在思考其背后的机制——为何这样的模式如此高效？

开源以极快的速度推动了人类文明的进步。因为代码是完全可重用的，一旦安装环境和基础设施搭建完成，开发者只需编写增量逻辑，就能持续改进世界。这种模式形成了明确的正向反馈，并能直接、深远地影响社会。

本质上，代码是人类的共识，而非自然存在的事物——它只是硅片上的 0、1 电位。换句话说，今天我们所见的程序和代码，或许只是历史长河中的暂时产物。理论上，最终硅应该能够自主生成和优化自身的 0、1 电位，进而成为一种能够独立解决问题的“物种”。

编程的发展历程已有 400 年，而现代编程的正式起点约在 100 年前。最早的计算机采用打孔卡片操控 0、1 电位，随后出现了汇编语言，以及 Fortran 等早期高级语言。随着演化，C 语言成为更高效的底层编程工具，可直接转译为汇编。而 Java、Python 等语言的出现，使得开发者能够用更接近人类习惯的方式编写代码。

实际上，所有编程语言的演进，都是硅逐步向人类思维方式靠拢的过程。从最初直接操控硅，到高级语言封装底层 API，再到如今的自然语言编程，编程的发展路径正是机器适应人类逻辑的进化轨迹。

ZP：您基本是 90 后里最早开始接触 AI 的学者，那 AI 从 2019 年到现在，有了非常大的市场变化。我想知道您在过去这几年里经历了哪些认知的改变？

吴承霖：说实话，我认为世界由一系列偶然事件构成。我们亲眼目睹了这些事件的发生，能够清晰地理解其中的每一个偶然——对于我们而言，认知是连贯的，但大多数人可能并不如此。

领域的发展源于 Tomas Mikolov 的研究，他的思路受到 Yoshua Bengio 等人在 2003 年提出的神经网络语言模型的启发。可以说，这一思路源自 Bengio，只是当时的计算能力和效率尚未达到要求。在 2013 年左右，word2vec 被提出，我们注意到它具有一些非常奇妙的特性。例如，词语之间的关系可以通过向量距离体现，如“man”与“woman”、“king”与“queen”之间的距离相似。在此之前，我们主要通过统计方法来处理词语关系。

word2vec 有两种典型的模型架构：CBOW（Continuous Bag of Words）和 Skip-Gram。这两种方法使用神经网络将词语映射为目标变量，这些目标变量也是词语。CBOW 尝试根据上下文预测当前词语，而 Skip-Gram 则尝试根据当前词语预测上下文。 word2vec 一方面标准化了整个建模方法，另一方面将自监督学习的逻辑进一步发扬光大，这是其中的核心。在此之前，大部分人工智能研究都采用有监督学习，即由人工标注数据，例如 ImageNet 中的人类标注图片，用于分类、回归或分割等任务。然而，人工监督的方法在理解复杂语言方面存在困难。虽然 Tomas Mikolov 并未长期任职于 Google，现在在欧洲担任教授，但他与 Ilya Sutskever（OpenAI 联合创始人）曾在同一团队工作，可以说他启发了 Ilya。因此，历史是由一系列巧合构成的。Tomas Mikolov 最初并未计划从事这些研究，他的工作一开始也遭遇拒稿，许多语言学者并不认同词语之间的向量距离代表某种意义。

到 2015 年前后，Ilya 提出了 Seq2Seq（Sequence to Sequence）模型。他实际上延续了 Tomas Mikolov 的思路。同年，关于 Attention 机制的四篇论文发表，逻辑相似。到 2017 年左右，关于 Attention 的论文增多，整个领域开始升温。2018 年，我们看到了 Jacob Devlin 提出的 BERT，其效果显著提升。之前我们手工调优的搜索 pipeline，如果加入 BERT 方法，效果远超之前的版本。即使仅使用 BERT 进行搜索 pipeline 的调优，其效果也略优于手工调优的最佳版本。

当时我们发现，虽然最初 word2vec 的应用并不广泛，但从 BERT 开始，大家探索出了一条完整的大型语言模型（LLM）发展路线。在这个过程中，每个人都未曾预料到自己能做出如此伟大的工作，大家只是凭借学术直觉将模糊的正确推向极致，而并未依赖高等级的证据。

此时，我想引入一个术语，即——证据等级。世界上存在许多观点，观点之上是共识，但共识很多时候没有证据支撑，就像比特币一样；共识之上是实验，实验分为低等级的纯观察和高等级的 AB 测试；最高层次是事实。

证据等级的不同会影响事情的效果。例如，为什么字节跳动能实现学术循环？字节跳动最初招聘的并非世界上最优秀的人才，但他们为何能成功？核心在于字节构建了一个优秀的 AB 测试系统。这个系统要求所有人用数据证明自己的观点，必须通过 AB 测试。AB 测试属于高级别的证据等级，如果没有证据，就无法证明观点，因此客观上迫使整个组织成为具备批判性思维的团队。

问题在于，对于许多实际问题，我们只能依赖模糊的证据。字节跳动内部总结，他们在某些方面做得不够好。例如，他们曾尝试复制知乎，但未成功。再比如，抖音的方法论最初尝试了几次，最后一次由于一个巧合才成功——当时选择了一个非常好的种子用户群，与之前的完全不同。他们并非有意为之，而是恰好做出了这样的选择。因此，要成就伟大的事业，模糊的正确也非常重要。只能通过许多模糊的正确来完成一件事，而不是在每个点上都进行 AB 测试。

如果分析 OpenAI 的成功路径，有 6 篇关键论文，其中 4 篇来自 Google，只有 2 篇是 OpenAI 的。因此，虽然他们比整个学术界前进了一步，但实际上也只是前进了一步。

ZP：您创立 DeepWisdom 这家公司，应该是基于某种契机或“模糊的正确感”的判断。那么，具体是在什么时间点促使您做出这个决定的？

吴承霖：在腾讯期间，我专注于自动机器学习（AutoML），并将其应用于搜索、推荐、NLP 和知识图谱，取得了显著成果。也正是因为 AI 在优化 AI 方面的优越表现，我当时获得了不少奖项。

在此过程中，我观察到一些行业趋势。2018 年，中国移动互联网的增长率已跌破 10%，意味着行业红利逐渐消退，创新空间受限。那么，在移动互联网进入存量竞争时代后，下一步该做什么？

我一直有做笔记的习惯，其中一个笔记本专门记录创新想法（idea），当时已积累了 110 条想法，其中 40 多条已被他人实现。因此，我列了一张表，设定三到四个评分维度，对这些想法逐一评估，并进行排名。最终，我选择了自动化作为最值得投入的方向，这也促使了 DeepWisdom 的诞生。

03 MGX 颠覆编程范式：自然语言生成代码，初现‘通用求解器’野心

ZP：能否请您详细介绍一下最近发布的 Coding Agent 产品——MGX？它的开发历程是怎样的？是基于哪些用户需求而诞生的？

吴承霖：最初，我们的目标是自然语言编程。MGX 就是 MetaGPT X，核心在于解决 MetaGPT 的产品化问题。在编写 MetaGPT 代码时，我们就已经构思了这一方向，希望从理论到实现都做到完整严谨。

智能体的架构可以分为三个层次：

1.底层：智能体的操作系统，相当于每个人拥有自己的计算机；

2.中间层：智能体的 IDE（集成开发环境），具备编译器，能够自主编写代码并生产各种应用；

3.上层：智能体的 应用生产与分发，即 AI 直接为用户提供完整的解决方案。

MGX 便是在这三个层次的推进过程中诞生的。

从应用结果来看，MGX 主要服务于普通用户的基础编程需求。举个例子，2013 年，我曾尝试搭建个人网站，使用 WordPress，但调整几个月仍不满意，最终放弃。这类需求的实现成本过高。而现在，用 MGX 搭建个人网站，效果远超预期，一个小时就完成了。

此外，还服务于用户在特定场景下的临时需求，如举办生日聚会、制作招聘海报、进行数据分析，甚至搭建一个小型 APP 进行团队协作，传统方法需要使用现成应用或编写代码，而 MGX 让 AI 直接完成这些任务，无需额外工具。

未来，手机界面可能不会再有固定应用，一切都由 AI 按需生成。

ZP：当时您有很多选择的方向，无论是学术还是商业，许多人都选择在模型层创业，构建大语言模型。而您为何选择了 Agent 而非模型？

吴承霖：自动机器学习（AutoML）是一个有趣的领域，它的核心在于自动化解决问题，而非特定的工具或方法。正如我最初所说，我们希望找到一个通用求解器，但我并不认为语言模型本身是理想的求解器，更倾向于构建 Agent 来执行任务。

此外，现实因素同样重要。自动机器学习通常有前置条件——如果没有足够的数据或信息对接，就难以实现 AI 解决方案。早在 2017 年，我就在知乎回答过“自然语言编程何时到来？”这个问题，创业时也一直在思考它的最终形态。2022 年 11 月，我对一些 CEO 和 CTO 表示，自然语言编程即将到来。但发表这一观点后，我觉得应该有人比我行动更快，我只需找到一个合适的开源项目即可。

然而，经过 4 个月研究 70 多个开源项目，我发现它们都无法满足我的需求。其中，LangChain 是我研究最多的项目，为此还写了 1 万多字的分析。它包含 95,000 多行代码，但通读所有代码后，依然没有找到符合预期的方案。于是，我决定自己来写。

2023 年 4 月 23 日，我写下第一行代码，到 5 月底产出第一个版本。6 月 23 日，Lilian Weng 发表了一篇关于智能体的博客，我一看，发现这正是我设计的理念。很多朋友问我：“你早就写好了，什么时候开源？” 于是，我很快将其开源。8 月份，MetaGPT 连续 17 次登上 GitHub Trending 月榜第一名，并取得了显著的影响力。有趣的是，我们想解决的 并不是大语言模型本身的问题，而是构建一个通用求解器，自动解决特定任务。

04 开源革命：4 个小伙子打造全球开放的 Open Manus

ZP：在开源产品方面，大家都对 OpenManus 的开发速度感到惊讶，认为是 3、4 位刚毕业半年的本科生，在一夜之间开发出的高效产品。这是如何实现的？团队的优势在哪里？

吴承霖：这其实是外界报道中的误解。我们内部有多个开发项目，许多工作未公开。确实，OpenManus 的开发是周三凌晨 2 点决定的；周四晚19点，团队成员开始动手，不到2个小时后就完成了发布。但实际上，其中一位成员已经在这个方向上积累了较长时间。你可以认为 OpenManus 只是我们一个较小的子项目剥离了一部分代码。

ZP：这种极高的开发速度，是否与您所强调的组织价值观有关？

吴承霖：是的，一方面，我们的团队成员具有极强的自主能动性，我们给予他们充分的自由；另一方面，我们鼓励大胆尝试和试错。创新的过程注定是高失败率的，90% 的尝试可能都会失败，但如果不鼓励试错，就很难做出真正有价值的创新。

ZP：Foundation Agents 作为一个 agent 开源的底层项目，有哪些功能？适用于哪些场景？

吴承霖：MetaGPT 1.0 版本已经部署在 Main branch 上（ZP注：主分支，通常指版本控制系统中的主要开发分支），尚未正式发布公告。简单来说，我们定义了基础智能体的架构、智能体间的通信方式，以及它们如何感知世界。智能体的运行逻辑类似于人类认知系统，分为四个核心层次：

1.感知：智能体直接接收数据，或借助外部模型形成对世界的认知；

2.认知：包括对外部世界的理解和自我思考；

3.行动：智能体调用工具，执行任务，形成 SOP 或条件反射；

4.记忆：类似人脑的记忆机制，包括短期记忆、长期记忆（语义 & 情境）和程序记忆。

我们已初步构建了基于这些层次的智能体记忆系统，并计划在本月内开源完整架构。

ZP：Foundation Agents 作为一个基础开源项目，如何进行商业化？

吴承霖：我们已推出的产品 MGX，目前在国内的 ARR 增长速度可能是中国历史最快的，但没有花费任何宣传费用。相比之下，增长较快的 Lovable 在前两次发布时完全没有流量，直到第三次才成功，这与其在宣传上付出的额外努力密不可分。再比如 Bolt，其背后的公司成立已有 7 年，早期主要做 WebIDE 相关业务，与 Replit 类似。公司遇到瓶颈后，才转向 Bolt 方向，并意外获得巨大成功。

ZP：也很好奇您如何设立 Benchmark 呢？

吴承霖：我们内部的 Benchmark 主要涵盖四个方向：

a.展示：包括 个人网站、LinkTree、产品宣传页、招聘页等；

b.分析：爬取内容并进行数据分析；

c.数据：生成报表、数据可视化；

d.游戏：比如各类的小游戏等等

每个需求都可以拆解为一句话的核心需求 + 五六个不同的 Feature。例如，做 2048 这样的游戏，我们会拆解为多个功能点（如排行榜、玩法优化），并以 Feature 完成度进行评分。在 Benchmark 中：

在某些特定场景下，我们具备非常明显的竞争优势。

05 学术循环：DeepWisdom 如何用“无权威文化”定义 AI 未来？

ZP：您的团队目前规模如何？核心成员有哪些？

吴承霖：我们组织内没有固定的 Title，所有决策由团队协商推进。虽然存在必要的审批流程和权限管理，但整体架构极度扁平，任何人都可以推动项目，管理模式非常轻量化。

至于外界较为熟知的成员，比如洪思睿，他是 MetaGPT 论文的一作，目前负责 NLP 团队。此外，我们团队还有一些在 AI 竞赛中表现优异的成员，例如：

￮向劲宇——阿里数赛 AI 赛道第二名

￮张佳钇——阿里数赛 AI 赛道第三名

ZP：您的团队成员都非常聪明，在各自领域有独特的认知，组织和管理这样一支团队无疑是极具挑战的。您是如何管理团队的？

吴承霖：最核心的一点是 没有 Ego。

a.鼓励团队成员放下 Ego，客观讨论问题，不以个人立场影响决策；

b.让每个人都以客体而非主体的角色参与讨论，避免权威论证；

c.推崇批判性思维（Critical Thinking），鼓励完整的推理与合理的逻辑判断。

我们强调的是 学术循环，而非个人权威。即使是实习生，对某个问题的见解也可能是正确的。在我们的团队里，不鼓励权威的形成。每个人都会犯错，不管多聪明，都会有信息偏差。因此，我们推行扁平化管理，在组织内部尽可能让“谁行谁上”，不设不必要的层级制度，每个人都可以自由探索并推动创新。

ZP：最近 Manus 迅速被复刻，您如何看待这一现象？

吴承霖：Manus 的产品设计与营销策略类似 Devin AI，本质上是饥饿营销。这种模式的关键在于选择最佳演示案例，如果展示 Bad Case 或者放开体验，就容易失去用户信任。

但实际上，Manus 仅在少部分场景有效，且无法预测，这种不可控性会让用户感到沮丧。MGX 基本不做营销，我们希望用户自主发现，而不是依靠大规模营销，希望它以更温和的方式影响世界。

ZP：目前 DeepSeek、LLaMA 等开源大模型不断引发市场关注。您如何看待开源模型的发展对我们赛道的影响？

吴承霖：目前来看，Claude 的整体效果更稳定，DeepSeek 的 R2 版本能否带来突破尚未可知。R1 的问题在于幻觉较难控制，如果幻觉问题没有充分解决，DeepSeek 很难在功能层面赶上 Claude。

AI 未来的发展路径仍然充满未知，但我们的目标是打造最好的系统，通过代码和 RL 优化整体效果。

ZP：在 Coding 领域，AI 技术未来将如何改变编程方式和软件开发流程？在大公司做技术支持，到现在成为创始人，身份的转变给您带来了什么样的变化？过程中有没有面临过什么挑战？

吴承霖：我的观点是——TikTok 没有消灭好莱坞。虽然短视频的流行对传统影视制作产生了影响，但并未改变电影工业的根本模式。

同样，当前 Coding Agents 的能力仍然有限，它们未来可能朝几个方向演进，但在这个时间点，我们还无法准确预测最终形态。短期来看，AI 更可能影响特定职业，比如数据分析师、前端工程师，而大型软件公司不会受到颠覆性冲击。软件工程仍然会存在，只是工具、形式以及操控它的人会发生变化。

如果自然语言最终成为最好的编程语言，那么编程的核心技能将变为结构化思维，而不是 Python 或 C 语言。编程的未来，或许并不依赖特定的技术背景，而是取决于思维方式。

ZP：您的创业愿景和使命已经聊得比较清晰了。那么，在具体的 Roadmap 上，您会如何推进？

吴承霖：Foundation Agent 相关的学术论文即将发表，这篇论文基本上就是我们的 Roadmap。其中定义了几十项核心任务，目前我们已经完成 5 项，剩余几十项仍在推进，挑战不小。

当前，我们面临的最大问题是组织的带宽（并发数）。前两天我们内部还在讨论如何量化团队的带宽，目前来看，团队已经接近满负荷，需要进一步优化资源配置。

ZP：最后想再回到您自身的感受，您过去在腾讯、华为等大公司从事技术工作，如今成为创业者，这种身份转变带来了哪些挑战？

吴承霖：这其中有很多复杂的感受。我习惯记录一切。2012 年到 2018 年，我写了 5000 多篇笔记，记下后就能把它们从脑海中清除。创业后，我也写了几十篇管理文档。

但管理公司远比想象中复杂，我的困扰在于，需要花费大量时间沟通，才能驱动一个人行动。如果我们能招募到更优秀、具备批判性思维（Critical Thinking）和高自驱力（Motivation）的人，或许可以减少很多沟通成本。

说实话，不论在腾讯还是华为，真正优秀的人才都非常稀少。在创业过程中，寻找、培养合适的人才，比技术本身更具挑战。

请注意，此次访谈内容已经过精心编辑，并得到了吴承霖的认可。欲了解更多关于吴承霖的信息，敬请访问其官方网站。我们也欢迎读者通过留言互动，分享您对本访谈或吴承霖的看法。

Z Potentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群，与我们共同分享、学习、成长。

——-

（文：Z Potentials）

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复