对话 ClackyAI 李亚飞:「套壳」之上还有厚度,数据闭环没那么重要


李亚飞做了 20 多年全栈工程师,技术社区和面向程序员的产品做了十多年,经手过数不清的软件项目。

时隔几年再跟亚飞深聊,感觉好像所有这些经历,都是成为了入局 AI Coding 的珍贵经验。人和事太匹配了。

ClackyAI 前几天开始内测,这是李亚飞团队发布的 Coding Agent 产品。

相比市面上大多数 AI Coding 产品,ClackyAI 主打为 AI 搭建的云端 IDE,因为有了完整的云端环境,AI 可以很快搭建好一个有前后端、数据库的专业级可用软件。「人类负责架构,AI 编写代码」是他们的追求,而对他们来说,云端可能是实现这种的唯一方式。

虽然已经是第三次创业,但几年前的 ShowMeBug 时期,亚飞身上依然有着极典型的程序员风格。这次再聊,他更像一个资历深厚的 founder 和 CEO,对创业节奏多了些从容,不再担心一些光靠琢磨也解决不了的问题。

据他自己说,是因为这几年下来,团队成长解放了他。同事的技术很好,产品很强,他有时间去感受行业,搞清楚公司在追求怎样的目标。

用刚刚加入他们团队,一位很卷的同事的话说,「他比我松弛,这是吸引我加入的很重要的原因。」

ClackyAI 发布内测后,我们找到亚飞,深聊很久,谈了谈他在产品背后的思考,对于 AI Coding 赛道的理解,以及带领团队加入大模型行业的创业感悟。

采访 & 编辑|万户、Nico


超 7000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

「套壳」的价值已经足够高了

Founder Park:之前的主力产品是程序员面试,对产品和程序员有什么新的积累或洞察,促使你们想做 ClackyAI ?

李亚飞:我们一开始就关注技术的核心价值,就是云编程技术。这个过程中我们尝试落地了一些不同的场景,让云编程的价值显性化。第一个想到的就是去识别对方的技术水平怎么样。在这个技术深度积累起来之后,我们很自然地发现,在提升软件效率这件事情上,AI 加入之后,整个的深度、复杂度都能够被大幅地简化。

其实在 2023 年的时候,我们就在做一些相关的探索。我们很早就有一个类似的 Agent 产品,也是自动化的。但当时受限于模型的能力,就当是做了一次验证。

到了 2024 年 Devin 开始火起来,虽然当时成功率可能只有 4%,但我们当时就决定下场,不要玩票了,整个团队全扑上来,全力去打。

Founder Park:回到 2023 年,是什么样的导火索或者事件,让你觉得这个事有必要带着团队下场?

李亚飞:Agent 开始形成初步形态的时候,那一刻我就觉得机会已经来了。但促使我真正下场,肯定是过了一年时间。

Devin 的发布是一个影响点。我们看到了 Agent 的可行性,可以真正落地。2023 年到 2024 年,我们还有一个产品,跟 Bolt.new 那种轻量级的方案类似,做了一些验证。

我们一直在关注 CDE 什么时候能切入真正的生产力。在 AI 诞生之前,我们是非常冷静的,知道 CDE 硬切生产力是不通的,前辈已经干过很多失败的案例了。我们只能在一些边缘 case 上做一些小作品,比如测评一下程序员实力。这种场景,程序员不用也得用,是有价值的,因为他需要在一小时内快速完成一个项目。

Founder Park: ClackyAI 这个产品,你觉得你想明白了的时间点是什么时候?

李亚飞:我们刚开始做的时候,就已经确定了。去年 4 月份立项的时候就已经想清楚了,Clacky  已经研发了一年了。

这一年,基本上我们团队所有的精力都在上面。可以这么理解我们这个公司,从类别角度,我们首先是一家 Infra 型的架构公司,搞应用层、云端电脑技术扩展这种特别有挑战的事情。再加上 toC 应用交付能力,我们是一个产品公司,一个「产品 + 架构」的公司。

Founder Park:然后就是要等模型成熟一些。

李亚飞:对,模型这件事情我们也趟了很多坑。我们的体感是,单 Agent 的表现力甚至高于非常复杂的 Agent 方案,比如 workflow 的编排方案,今天都要打个问号。模型能力上升之后,为什么要编排呢?灌进去更多工程化的 know-how 给它就好了,辅助它变得更聪明。

这件事情是平权的。今天来看,任何具备专业工程能力的团队,Agent 本身的偏离度不会很大。就算是顶级模型公司的团队,也不一定更好,为什么?他们不能用对手的模型。一旦对手的模型水平比他高,他就尴尬了。所以今天我觉得是分层的,模型公司有模型公司的玩法,应用公司有应用公司的打法。我们可以自由地去找最好的模型合作伙伴进行适配。

关键的 know-how 是我们产品正确的定义方式,以及给 AI 更好的 tool-calling 的能力。这个 know-how 是相对比较深的。

Founder Park:现在套壳已经变成了一个很积极的词了。

李亚飞:哈哈对,在模型能力上就是套壳,本质上是这样。但是在应用产品定义、流程设计上,又有很多讲究。

Founder Park:应用的价值正在非常陡峭地增长,斜率远比模型更高,未来大概率会出现比模型公司价值更大的应用公司。听起来对你来说的现象就是,「套壳」这件事足够复杂,能够聚拢价值的时候,你做出了下场的判断。

李亚飞:没错。今天聊这个事,跟几个月前的感受真是完全不一样,当时很多人都不理解。


02 

数据积累的优先级并不高

Founder Park:他们不理解的点是什么?

李亚飞:他们会问,你 Agent 怎么架构的?做了什么微调?怎么积累数据?一两个月前,我就说这些都不重要。今天我会说,在应用层积累数据让模型变得更好的事情,都是扯淡,都是骗你的。

Founder Park:数据是不太一样的。如果我们按照产品形态来看,Agent 有 workflow 的高价值数据,Chatbot 大多是低价值数据。但如果按照数据是给谁用,一部分是用户价值,一部分是 AI 价值。

李亚飞:我们应用层讲的所谓「数据闭环」,其实有很强的闭环可能性,但我一点都不想碰。

我们是多线程的任务,一台电脑干一件事情,干完之后它会提交代码,这有点像强化学习的自动标记,然后我们会有一些人类介入的机会。AI 干一轮,人类可以介入一些,介入完自动标注。因为代码合入了,就认为 AI 干得不错,或者人类调了什么,都可以被记录下来。这轮数据其实是自带一个闭环的强化学习语料。

假如说一天能产生 100 万条这样的数据,是不是就形成一个庞大的知识库,未来会灌给模型?这个其实有点 make sense。

但我觉得今天来看,很多情况下我们这场战斗是生死不明,各方面都在快速演进。还不如极致地进行套壳,把模型本身的实时判断能力发挥好。未来那个闭环的事情,你今天去积累,未来可能有效,甚至现在不积累,未来再积累也来得及,永远不晚。

我也同意,在垂类领域肯定也会成长出很多大公司,应用一定是最大的市场。Infra 是今天的光环,就跟当年互联网上市,思科是最值钱的。但今天思科就变成真正的基建了,今天的主角还是字节、腾讯这种真正普适大众的。

Founder Park:我想把数据这个点问明白。你刚说,数据当下不太重要,或者说后面积累还来得及。现在大家去 value Cursor,一个是它形成了品牌价值,另一个是它里面也有工作流,它有数据。

为什么你会觉得,比如说等个两个月甚至更久的时间,再去拿这个数据也来得及?

李亚飞:我的看法就是,数据闭环都是扯淡的,这是投资人安慰自己的护城河。Cursor 里面出来的绝对都是垃圾数据,聊天数据都是垃圾数据,它不形成一个真正的强化学习建议。

这个事情不形成模型决策。你去用这些数据,恐怕效果可能会变差。模型是有泛化能力的,本身参数够 OK,然后训练的奖励函数可能要比你这个数据重要得多。

Founder Park:所以你就需要让模型更多去做决策,然后用户给你反馈,这个过程也不那么急。

李亚飞:对,这个在今天是平权的,不重要,真的完全不重要。


03 

用 AI 做专业级产品,

是非常重要的命题

Founder Park:AI coding 现在很火,出现了很多明星产品。想问一下亚飞怎么看?

李亚飞:这些产品分为两大类:一类是云端的,就是在线上运行;另一类是本地 IDE 类的,在本地跑。云端类的,我觉得更偏向未来,好处是我可以以很低的成本去接触。而本地化的,走的是专业性路线,比如 Cursor、Windsurf、Trae,一看就是程序员做的。

还有一个区分点,就是是否「Agent 化」。很多工具是「+ Agent」,不是 Agent 原生。现在本地化的就偏向这种状态,大家可能都讲自己是 Agent,但实际上只是一款有兜底的工具。

云上的版本,今天 Lovable、Bolt.new,还有很多相关的垂类产品,大家能(用它们)做出产品,但只能做出 Demo 型的产品,可能就纯前端,做个交互。

Founder Park:你们的产品思路是怎样的?

李亚飞:可能是因为大家完全不想接触代码,所以只能交付出这样的东西,专业性就大打折扣。但我们真正想用它来做专业产品,没有人会做个玩具拿出来秀。当然,也有一类就做得非常玩具化,比如做些小游戏去分享,但那个不属于我们这个领域。我们觉得两者之间有一个非常好的融合机会:把专业的东西变简单,但我就是来做专业产品的。

今天我们还在持续打磨,但这种感觉已经出来了。做 Demo 级的产品,都是给一个前端页面就结束了,可能带一些交互,但都是假数据。而真正的产品,有前端、后端,再加上真正的数据库。一定要有真正的数据库。这一层虽然听起来有点复杂,但通过让 AI 来帮忙,大多数时候是可以不碰数据库的。

这套东西上线时间不长,但我们在水下打磨的时间比较长,所以我们在这方面可能是最早能体现出 build production level 能力的。现在很多所谓能打造「专业级产品」的,你去用它 build,结果他告诉你数据库都接不上,那怎么叫专业呢?

Founder Park:你们产品打磨时间比较长,经历了什么样的过程?

李亚飞:首先,我们有大概三年的云端编程技术的架构积累。 Bolt.new 的云端方案其实也积累了比较久,从 2017 年到现在。但是我们俩技术方向不太一样,它偏重前端,我们支撑全栈架构。

第二点,ClackyAI 去年 4 月份立项开始做,到现在基本上是一年的时间,做了非常多的工作,来支撑我们今天做出专业产品的这种技术能力。

Founder Park:3 年前搭建云端环境,当时是为 ShowMeBug 准备的,还是已经在摸索新的产品方向?

李亚飞:严格上说,ShowMeBug 不完全需要这个东西。但我们在业务成立之初就看到了一个点,我非常看好云上编程技术。这是整个软件研发,从本地到云端的一个大趋势,是最后一块难啃的骨头。

另外,我们也支持一些协作技术,因为它自然而然会让你进入研发的外部循环。在本地开发属于内循环。

为什么功能强大的本地版大家不用,一定要用云上的?核心在于,可以用更轻、更协作的方式去打开它。它融入到整个工作流,融入到整个软件交付的过程。比如我写完软件要测试,都是在云上;要验证代码正不正确,CI 一下;甚至要部署上线,都是在云上。而且我们团队的协作也经常在云上。

所有这些都指向云上开发的机会。这一定是最后一块核心。今天之所以还有挑战,是因为有用户习惯的问题。本地上云都需要花很长时间,比如 Office 时代,也花了非常长的时间大家才完全接受。

Founder Park:如果做类比,你们在做的云端协作状态,是不是有点类似于软件工程领域的 Figma?

李亚飞:对,这个协作在今天来看非常自然。但以前可能还有些挑战,比如同步协作还是异步协作。我们的 CDE (Cloud Development Environment) 是能支持同步协作的,就是两个人可以一起进来。但两个人一起写代码不太现实,可是互相 review、调一下,这是 OK 的。

以前有 Git 仓库,也就是代码管理仓库,解决了异步协作的问题。今天也很自然地继承了。但到了今天,有一个巨大的变量进来了,就是 AI。AI Agent 很自然地加入到团队,加入到开发过程中,人类跟 AI 自然而然就形成了一种互动协作的状态。

现在可能人类占八成,AI 占两成。但是我们现在做的产品模式是人类五成、AI 五成。今天的模型能力已经能扛住了,而且模型能力还在变强,成本还在下降,这个就很自然。

IDE 的工作,AI 一定要跟人有一个工作空间。再往下一步想,就像有一个人如果能帮你干活,干得不错,你肯定不满足于只雇一个人,你想要雇两个、三个,有钱就雇十个。所以这个过程一定是在云上发生的,就像一个文档、两个文档、三个文档。在我们的体系里,就是一个 thread、多个 thread 这样不断发生。今天应该是未来新编程范式的一种缩影。一切在今天好像变得很自然了,而在几年前,可能只是一个愿景,我们笃定未来五年云上编程的事情一定会发生。

Founder Park:Lovable、Bolt.new 也是云端环境,只是可能更多是搭建前端。它们也是市场比较喜欢的一类产品,你怎么看它们?

李亚飞:这几家都很聪明,聪明的点在于,可以先快速地闭环一个产品。比如 AI 可以写简单的前端代码,这是最容易解决的,因为它不需要真正的运行环境,CDE 都是简化版的,非常轻量。如果我没有这个积累,我来干,我肯定也先干这个,不会一上来就花三年先干个底座,我得先活下来。所以自然而然,它会形成这样一个循环,先建起来,获得市场认可,然后再往前滚动。

但我觉得我们最终的目标,一定是构建专业级产品,这才是满足人类的最终画面。

举个例子,前几天一个朋友找我,说他想做个小程序,要有课程、支付、活动报名这些功能,预算五万块钱。在我们之前的标准里,五万块肯定不够。后来我试着把他的需求塞到 ClackyAI 里,居然像模像样地把一个技术栈搭出来了。我以前做这个,得先花半个月把技术栈扎好,找个研发写非常细的代码。但我发现,用 ClackyAI  可能一个小时就把核心脚手架搭好了。感觉我努力五天就可以交付给他们,收五万块钱还赚了好多。如果一个工程师效率很高,一个月交付四个这样的项目,那成本就下降非常多。

再往下设想,凯文·凯利在《失控》里提到过一个「千人粉丝」理论,也就是说,你只要有 1000 个铁杆粉丝,就可以在社会上活得非常滋润。他当时举的例子是卖数字音乐,但其实卖数字软件或者服务更 make sense。原先你可能需要雇一个六到八人的研发团队,一年好几百万。但现在这个状态下,可能一两个人就把这个事完成了。这样的话,服务这 1000 个人就足够养活你了。社会就会空前繁荣,因为社会分工很细,任何小需求都可以被满足。

所以,SaaS 肯定不好干了。SaaS 本质上是让用户买一个标准化的产品,主打点是软件构建很贵,用户都买不起,只能买标准商品。但今天如果软件都个性化了,而且够便宜,这个商业模式就不成立了。

回过头来说,build 专业级产品,一定是一个特别核心、重大的课题,也非常有意思。谁能先把这个成本真的降下来,谁就可以获得先机。

我是一个做过很多产品的人,在 2014 年就开始创业,我技术上还可以,产品也做了这么多年,又是「研发 + 产品」的属性。这个时候,ClackyAI 就可以把这两者之间的关系进行最佳的平衡。这也是现在那些新的创业者所欠缺的。因为初创团队一般都非常产品经理化,他们可能没有那些 know-how,不知道 build 专业产品水下还有好多东西要搞。

我的任务是把这些水下的东西构建好,让产品经理们不要太害怕,尽量把有些东西隐藏起来。这是我们关键的一个认知。

Founder Park:降低门槛,让小团队,甚至两三个人,就能做出好的专业级软件。

李亚飞:对,甚至一个人。我觉得只要成本降下来,它有一定的学习门槛都是值得的,毕竟构建这样一个软件的价值非常大。

Founder Park:Lovable、Youware 也都在做一些轻量级的后端和数据库。再过几年,用他们的产品来生产一个普通人能用的东西,也是一种可能。假如以后这样的产品让普通人都能自己给自己做产品了,是不是会影响专业级软件的市场?

李亚飞:非常好的问题。今天大家不是没有看到做专业软件的价值,你也看到他们在尝试接入数据库,之前低代码型数据库现在也受 AI-coding 发展的助力,大家也很看好,融资也很好。

但这里面核心点在于什么呢?我觉得是对软件开发的 know-how 的 PK。

软件开发不仅要快速上线,还有很多要求。第一,它有安全性的要求,并发性的要求。两个用户用没问题,十个人用就开始出问题了,或者安全不行,比如用户登录就串台了。这是非专业开发常遇到的隐藏问题。也就是说,一定需要一些状态管理比较强的后端能力,这个是必需的。这些产品在 0 到 1 的阶段可以快速搞出来一个东西,但是 1 到 10 可能就不行了。

还有一个明确的思考就是,一定要重复使用人类现在已经形成的最佳实践,而不是再发明一套类似于低代码或无代码的组织方式。我们必须拥抱通用的技术栈。举个例子,数据库,我以前也想过自己发明一个,后来发现还是 MySQL 和 PostgreSQL 好用。它在整个应用研发里面是最稳定、最好用的架构。上手门槛是高,但是我们可以把它隐藏起来。比如我已经提前给你装好,AI 提前连好,然后映射成一些上层的服务。这个可能比较专业,但理解起来就是,操纵数据库就跟操纵一个对象一样简单。

从这个角度来说,它会被抽象到普通的产品经理都不需要考虑太多,你告诉它需求,它就给你写进去了。但是真的要维护的时候,人类又可以参与进去。这就补充了一个新维度:可维护性。软件是持续迭代的,它不是一次性的产物,写完扔在那,这不是真正的软件。进化的过程中,你就需要一个良好的架构、良好的骨架来管理你的项目。

这个时候,良好组织架构的作用就体现出来了。而且人类工程师这么多,都很厉害,需要的时候可以喊他们进来。专业工程师也喜欢用简单的工具,就像我们 Office 专业用户发现云端轻量级的好用,我也会用,这并不矛盾,它是一个逐步变革的过程。

所以,从可维护性来说也需要这个东西。

Founder Park:也就是说,专业软件,不管到什么时候,都是一个有复杂度且要求持续迭代的东西,而不是一个很快交付完、之后就不需要再怎么维护的东西。

李亚飞:对。而且我们所谓的「专业软件」,换个角度表达,是因为大家生产的东西都太玩具了,所以我们是在讲「我不玩具」。其实任何软件都是这个属性,只要你不是玩票的,不是一次性展示的网页,大家看一眼就结束了。只要有用户访问、要更新数据,那都是专业软件,都是真正的产品,都需要持续维护。

有个说法是,代码生产出来是有负债的,是要还的,不是说你放出来就成功了。因为时代在变,技术在变,升级迭代都是非常常见的,你不维护,时间长了可能网站就垮了,或者某个接口失效了,就用不了了。所以才需要可维护性。


04 

AI Coding,

架构师在未来可能会消失

Founder Park:ClackyAI偏向于产品经理需要你会策划、梳理清楚需求,大概懂一些代码,核心是用一个 AI 帮你实现项目的能力。那是不是说,你们把所谓程序员的能力和行业垂直实践给 AI 化了?

李亚飞:对,因为我们做了很多产品,作为乙方,打磨了很多可以商用的产品,所以我们对构建一个真正产品的 know-how 还是比较深入的。我们的想法是把这些东西包裹掉,成为一个更简单的产品。

我们内部说,这是一个「既简单又复杂」的产品。它在大多数时候是简单的,因为有 AI 驱动,我们可以更高效地完成交互。但它也有复杂的一面,因为构建软件工程本身就是复杂的,就像设计稿、写文章一样。专业的东西就是有专业性在里面。在必要的时候,我们可以让人类参与。

假如说从 0 到 1 做好了,用的是标准技术栈,在从 1 到 10 的过程中,是可以有一个成员进来的。你可以用 ClackyAI 继续搞,但也可以手动挡模式参与迭代。我觉得这一定会比同类的产品更早地帮助社会推动到一个更有利的状态。

而且我们认为 AI 的思考并不是万能的,它是一种思维机器,我们叫「电子大脑」。它也有短板和盲区,也需要更多的信息来进行自我循环跟迭代。开发软件也是这样的一个过程。

Founder Park:你刚提了最佳实践这个点,本质上我们现在用 AI,好像就是在把最佳实践给强化学习进去。

李亚飞:这个地方我的画面是「电子大脑」。它更像是一种决策机器,就跟人一样,人是一种复杂的决策系统。遇到不同的情况,会根据实际情况实时进行推算,一个微小的偏差就会带来巨大的决策变化。

以开车为例,可能看到前面有个白白的东西,人有世界知识,发现那是个塑料袋,就一脚油门冲过去。但如果晚上看不清,不知道是什么东西,你会一脚急刹车。同样一个场景,不同的决策。

今天的 LLM 大模型,其实也是另外一种电子大脑,也是学到了很多东西之后进行决策。如果它只是个记忆系统,那今天绝对没这么强。它也是喂了这么多数据,最后好像理解了人类的想法,然后吐出一些自己的想法。

今天教 AI 怎么搞最佳实践,绝对不是说给它写一份文档,告诉它以后就照这么写,代码写完交付就完成了。绝对不是。因为需求非常复杂,各种各样的情况都会发生。那怎么办呢?其实我们更多是要教它一种形成自我迭代、自我循环的能力。

怎么个循环法呢?很简单,编程有一个最基础的 know-how,就是写完代码一定要进行测试。测试又分很多方式,比如语法级的检查 (Lint)。现在的大模型已经不太会单文件写出错误语法了,但是两个文件连在一起互相有关联,它就有可能遗漏。人也经常会犯这个错。以前的 IDE 牛就牛在能自动进行语法关联的跳转和校验。

但今天的 AI,不管给多好的提示词,多好的语料训练,它跟人一样,在实战的时候是想不起来调用的。所以我们更应该给它一种自我循环的能力。比如我们有自动化测试、单元测试、接口测试。还有最牛的方式,我们内部都叫「人肉测试」,就是测试工程师 (QA) 直接上场去测,或者研发人员自测。很多东西是工具都替代不了的,还需要人进行决策。

这个测试过程 AI 是可以做的,所以也有很多投资投向了 AI 测试员。但是我们在工程研发的时候,这些也是自动闭环的。一个体系如果不能自动闭环测试,我觉得它是不完备的。当你建立这个 know-how 的时候,你就会发现,离不开一台完全受控的云端 CDE。Lint 在哪里跑?单测怎么运行?环境要不要安装?还要开个云端浏览器,甚至未来可能是个 App 模拟器。这件事情想想就很复杂,它不是三个月开发一款产品就能闭环掉的。

Founder Park:不管产品经理还是高阶程序员,他们最厉害的可能是架构的能力。这个能力现在 AI 有吗?

李亚飞:以前程序员最顶级的职位叫「架构师」。但很多年都没有标准定义什么是架构师。不同公司的架构师职责完全不同,有些是业务架构师,有些是技术架构师。

今天的架构也是个很抽象的词汇,本质上是保证软件地基没有失控的能力。比如说,明明这个地方已经有一个接口了,非要再写一个,这就是架构腐朽的开始。等写多了,其他人再来维护的时候就懵了。所以我们建立了一些规则,比如不要重复自己,架构要简单,要用一些依赖反转等非常专业的术语。

但这些东西一直都没有什么标准化体系,每个时代都在打破一些规则,新建一些规则,只能靠一些有经验的人来判断。今天的 AI ,其实有架构上的 sense。但架构这件事,本质上对上下文要有极强的抽象和感知能力。所以今天的 AI 不擅长搞架构,因为它经常忘了上文,不知道之前为什么这么写代码。我们人类一年以上的事情还能记得清清楚楚,对今天的决策还会有影响,但是 AI 不行。

这件事情上,我的判断是,今天没有有效的解法能马上解决架构失控的问题。怎么搞呢?我们提供了一个有效的兜底措施。把人力工程的最佳实践还给人,比如该托管在 GitHub 就托管,该 review 就 review 。不想 review,就合并,基于你的项目情况来决定。然后提供有效的回撤能力。

如果第一天就希望产品未来是 IPO 的,支持一亿用户,那你第一天就应该进行详细 review,让 AI 每一次的交付你都可以详细地校验。多花 30% 的时间进行架构重整,OK,你可以控制得很好。但如果今天竞争生死不明,要 “dirty and run”,那就赶紧发布。等到中途某个阶段再停下来重构。这些以前人类实践中都有的逻辑,都可以在 AI 时代重放一遍,让 AI 帮你重放一遍就够了。

Founder Park:那是不是可以理解为,现阶段 ClackyAI 提供的交付,架构还是需要人类来更多地去考虑?

李亚飞:对,另外我们提供一个回撤能力。AI 还不太能百分百完全控制住架构的孵化。我们是尽可能地把上下文给 AI,让它写代码时尽可能去参考已有仓库和项目,少写一些无用代码。

Founder Park:架构师其实是一个挺有意思的话题。大家常说 AI 其实擅长「模糊计算」的东西,而不是精确计算,这就意味着它理论上应该非常适合做架构设计的工作,你怎么看这个观点?

李亚飞:没错。我觉得今天它的智商、判断力是够做架构师的,但有个前提,架构师要对未来有预测,对历史很清晰,知道现在的架构里哪些能动、哪些不能动。模型今天的记忆能力还比较难有效地解决这个问题。但是我相信未来,各家 coding 厂商可能会逐步摸出一条路来,而且模型也在进化,说不定谁出了一款记忆深度比较强的模型,我们也可以把这事情搞好。

Founder Park:AI未来一定需要架构师能力吗?

李亚飞:在我们的体系里感觉还好。只要 AI 按你的规范帮你写好,不产生架构污染,那架构师就不重要。一个小公司哪来的架构师?只要别老翻车,别经常并发不行,架构师就不用出马。我们因为对工程 know-how 比较熟,知道哪些东西容易导致工程风险,那我们尽可能去引导 AI 避免。而且我们提供了一种团队协作能力,必要的时候你是可以邀请人进来的,邀个架构师进来帮你重整一遍。

Founder Park:在人与 AI 一起写软件的过程中,架构师这个职业还重要吗?

李亚飞:我觉得咱们可以对架构师去魅,这只是行业分工的一个需要。新的软件开发体系里面,假如说一个千人公司,架构师是重要的。但也许未来都是十人、三人的有限公司,软件都被分散掉了,那好像就还好。工种没有那么刚性了,还是不同的组织形态有不同的需要。

架构师有点像一个必要的技术管理成本。因为人跟人之间的合作太没法预料了,所以要有一个架构师来兜底。但如果未来都是 AI 来写,只要 AI 遵守规范,理论上就不太需要所谓的兜底的架构师存在。

我觉得思考架构这个事情应该是持续存在的。只要它是跟你一起工作,你就应该是个「架构师」,因为你负责最终的结果。我觉得它会变成一种新的状态,人类更像是一种把握逻辑关系的负责人,比如说「逻辑设计师」,或者「业务设计师」。以后程序员或者产品经理,大家都可能往这种方式上转,大家可能是同行,哈哈。


05 

AI CDE 的核心是 AI,不是人

Founder Park:直观觉得 ClackyAI,选择云端的 AI CDE 在当下是一个很取巧的设计,它是一个完全为 AI 开发的、更容易获取上下文环境的产品搭配。那对 ClackyAI 来说,现在的瓶颈会不会是,卡在了模型本身没办法很好地利用这些上下文?

李亚飞:我反倒觉得现在做 AI IDE 算是个取巧,但做 AI CDE 是个硬刚的事情。因为 IDE 有现成的开源东西去做,加速了很多。但 IDE 的局限性在于,Agent 的原生能力是不如云上的。Agent 的未来是在云上。

Founder Park:在云上是因为它可以有一个完全为它搭配的环境吗?

李亚飞:对。换位思考,如果你是 AI,你希望在哪里工作?是自己的环境,还是要住在人类的环境里面?在人类的环境里只能是初级阶段,也就是在本地。如果你不信任 AI,那就在本地,你随时可以打断 AI。但如果随着 AI 能力变强,比如到了五五开的时候,人类就会倾向于把它放上云了。

虽然 CDE 跟 IDE 差了一个字,但它提供了几个重要的能力延展。第一,它背后搭了一套完备的云端 coding 环境给 AI 用。给 AI 一台空白电脑,这对任何人类工程师来说都是巨大的挑战,没法干。但现在很多云端 Agent 就是这么玩的,很多测评第一步就卡住了。

所以我们需要给它配备很多「瑞士军刀」,让它不那么难受。

配一个顺手的云端电脑给 AI。比如我预装了环境,预置了一个通用的 Python 版本,它需要新版本自己会装。再比如装数据库,数据库是个老大难问题,需要下安装包、配账号密码、初始化、创表,光这一堆工作,对一个高级工程师来说都是很高的学习门槛。但我们要把这个 gap 给它拿掉。AI 调个接口,就装上来了。

我们怎么做的?其实就是通过我们自己的一个写时复制 (copy-on-write) 的文件系统,把一个成熟的文件系统拷出来。这是我们人类的价值,帮 AI 搭好这个基建。

AI 进去之后就可以开箱即用。而且我们还提供复制能力,它进行分身的时候很容易复制出一个新的环境继续开发。最后的环节才提供了 CDE 跟 IDE 相同的地方,就是人类交互界面。人类进来一看,好像还是熟悉的样子,但其实底下都不是你熟悉的东西,冰山下有很深的东西。

我们现在也正在根据用户的需求去找到平衡点。但话说回来,为了让 AI 能够闭环工作,必须是云端浏览器。

Founder Park:本地的难度会在哪?

李亚飞本地的核心问题在于,它很容易被人类打断互动,它占用你的资源,没法真正的异步。如果它本地想真正异步,它也要装个 Docker,本质上跟云一样,那为什么不直接放云上呢?所以,本地 Agent 是某种意义上的过渡形态。五年后再回头看,就会发现今天肯定是启动阶段。

Founder Park:所以 AI CDE 的交互界面,更多是为了给人类搭建一个他们熟悉的界面,但其实这个界面对于 AI 来说是可有可无的?

李亚飞:对,AI 工作的时候,你能看到,这是我们提供的一种产品设计。为了让人类对这个东西有更多的信任感,因为能看到它做事的整个流程。

Founder Park:CDE 本身也不是一个新东西。如果 CDE 的云端优势这么大,它却没有取代掉 IDE。为什么现在你觉得 AI CDE 会把 IDE 给取代掉呢?

李亚飞:非常灵魂的问题。我先说答案再讲过程。CDE 技术其实发展了很多年。现在 CDE 和 IDE 的体验相比还是缺乏一点低延迟的爽感。另外附加了新的成本,比如云电脑。所以 CDE 大多数时候被用在快速构建项目、教育等场景,一直没有成为主流。

再打个比方,就像 iPhone 开拓了智能手机市场,我们觉得很 make sense。但其实在 iPhone 之前,已经存在了七八年的 PDA (掌上电脑),但它一直停留在一些专业玩家手里,没有被大众化。直到后来算力、电容触控技术等新的变量起来了,成本下来了,卡顿感小了,终于有远见者把它造出来。

CDE 跟 IDE 之间以前也确实有一些难缠的问题没有被解除。但到了这几年,AI 的变量加入之后,CDE 就有点像智能手机一样开始「智能」了,突然成了最适合 AI 工作的场所。原来的基建设施突然变得非常有用。这就像操作系统移动化之后需要重新定义一些东西,我们发现在这个过程中也重新定义了很多,比如数据库的扩张,我们提供了分支的能力。海外有一家成功的公司叫 Neon,他们的核心点就是可以快速复制数据库。

所以,新时代的新东西在变化。CDE 里面的很多东西,比如 Lint、数据库、项目运行,我们可能都要重新定义一波。我们甚至有专门为 AI 留的终端 (terminal),人类用那些,AI 用这些,大家形成互动。

再往前推一下更有意思。今天的主流编辑器 VS Code 的创始人,他 2010 年就开始做编辑器,第一款就是 Web 端的。做了两三年发现不太行,就把它抽象成一个框架。到了 2015 年,连人带项目卖给了微软。在微软,他把 Web 端打包成了一个本地版。慢慢升级,才做出来 IDE 的形态。然后通过 Web 技术打包发布桌面端的方式火了,到了 2019、2020 年就占领了市场。

但是大家不要忘了,它一开始就是 Web 端的,现在它还有一个 Web 端。上云、Web 化一直是整个世界的一个梦。AI 技术成熟之后,我觉得这件事情重新成立了。


06 

关键的 know-how

是最小测试单元

Founder Park:对 ClackyAI 来说,比较重要的上下游是什么?

李亚飞:你把我们当做一个「产品 + 架构」或者「产品 + Infra」的公司就好。我背后有一个自研的 To B 架构,上面的 Agent 是套壳,但是 Agent 的 know-how 我觉得挺深的,软件工程的 know-how 是我们比较核心的东西。我们设计出来的整个产品流程和筛选逻辑,是我们最大的认知。

Founder Park:那些认知对于这次做 ClackyAI有什么样的帮助吗?

李亚飞:对,know-how 的认知,就是这次的工程实践。

比如架构。我把架构其实拆成了很小的一些事情,慢慢落到整个体系里面。再比如编码的最佳实践,就是形成一个最小闭环,越小越好。写一个文件就测一下,这样交付是更可靠的。这就是它的 know-how。我们还有些地方在逐步深入落地中,等下一版推出新的效果方案,会比这一版再提高 30% 到 50%,可能就已经是业内顶级水平了。

Founder Park:复述一下我的理解,你刚提到一个测试的最小单元,如果我们尽可能小地去测试它,确保结果是正确的,就能保证项目 run 下去比较顺利。这样一个流程,是不是你们一个比较领先或独特的 know-how?

李亚飞:那肯定,因为最终体现出来的是 AI 效果。我们对 AI 效果的认知是,模型本身是平权的,Agent 本身相差不是特别大,但关键的点在于 coding 领域的 AI 效果的 know-how,就在于形成一个快速的最小闭环。比如我必须把云浏览器驱动进来,必须把 Lint 工具驱动进来,而且是给 AI 专属的一系列体系驱动上来,这样写出来是最好的。

当然,前面的东西不是不重要,只是说那些东西,你给一个团队一年时间,可能也吭哧吭哧干出来了,但是后面的东西干不出来,而且不一定有那样的 know-how 去干,他们没有那个工程经验。

Founder Park:你们的过往行业积累,是你们现在的一个产品壁垒。

李亚飞:对。但今天我非常愿意分享出来,让大家都知道这个 know-how 也没问题,大家都可以来参与。

我们既然放出来,就已经做好了准备。能看懂的消化了,看不懂的也不一定能吸收,这个世界就是这样,没关系。

Founder Park:感觉它不一定是叫 AI CDE,可能更是一个 AI DE,你们本质是想给 AI 搭一个云端的、纯粹的软件生产环境,只是顺便让人类来监控一下。

李亚飞:是的。今天还很需要人,所以我觉得我们率先能跨越这个鸿沟,就是 IDE 的效果跟人类不信任之间的鸿沟。我们把这个 gap 给填了。为什么会带有人类的交互?我们花了比较大的力气去把它架上。因为你不能完美主义,一开始就推论到终极形态。当年的 AutoGPT 就是那样,你输入需求,它吭哧吭哧干,最后发现只能写出来一个简单版的贪吃蛇。

我觉得今天还是要贴合人类的实际,贴合真实市场的状态,把这个 gap 给填了。

Founder Park:你们觉得 ClackyAI 现在到达 L3 级别,是基于什么样的判断?

李亚飞:L3 就是人类跟 AI 驾驶能够各占一半。当然我们内部还会分一些小等级,3.1、3.2、3.5。我们预判会慢慢过渡到 3.7、3.8,这个时候不需要人类介入太多,我交付任务,它通知我,我再查收、合并。但总是有一些架构上需要人类介入的东西。我们把它定义成 3.8。但我觉得今天已经开始往 3.5 行动了。

我们说的 L3,其实特指的是从 L3.0 到 L3.9 之间的变化。反而 L4 是简单的,把图形界面去掉,它不就是 L4 吗?我觉得 L4 还远远没到,等到的时候再说。

Founder Park:3.5 是个什么状态?

李亚飞:3.5 的状态就是我们倾向于 50% 的任务,AI 直接就交付掉了,也就是说有一半任务人类需要参与。交互方式会发生变化。比如今天是你制定一个 plan 之后,一定要点 start。可能再过两周,那个版本里就是 10 秒后不确认,它就 start 了,哈哈。

Founder Park:所以 start 按钮只是让人类有可控的假象?不点也会开始运行。

李亚飞:对。你点了,还可以自己看一看。但可能在 3.5 的状态就是,啥也别说,先干了,干完之后你发现不行再撤回来。到 3.8 的时候,你撤都不用撤,干完最后回放一轮,发现这个地方有点小问题,要么自己下场改一下,要么让 AI 改一下,就结束了。3.8 之后,我们可能重点打磨的就是,一个大需求进来,AI 帮你拆分到需求池,然后派发多个 Agent,看你花多少钱,然后他们就开始分配工作,把这个交付了。

Founder Park:现阶段 Clacky 是怎么平衡 AI 的自动化和开发者的可控性的?

李亚飞:我们思考的方式是,把复杂的东西包装起来,然后把简单的界面交给人类,我们这个产品的定位,是只要你有动力创作作品,敢去理解一下代码、碰一碰就行,不要慌。Web coding,web debuggiing 这个过程应该让大家是舒心的。在这个过程中,你不太害怕代码的时候,其实可以反问 AI,甚至可以撤销掉,再试一试,慢慢你可能就理解了代码的逻辑。你也可以摇人,大胆地摇一些程序员进来。他们跟你协作。这个时候,大家就可以享受云端文档协作那种感觉,协同工作。

Founder Park:关于上下文,现在怎么更好地解决这个问题?

李亚飞:对,这个又是一个云上的优势。因为云上可以持续记忆你的上下文。比如我上一个 thread 跟下一个 thread 之间,它其实会产生一定的记忆连接。但在本地,你一旦开个新的 chat,它就丢掉了。所以我们根据软件工程的需要,把多个 thread 之间形成了一个共享的上下文工作区。大家会把不同的东西放进来,有需要的时候再根据一个规则把它拿出来。

Founder Park:有点类似于 ChatGPT 的共享记忆库。

李亚飞:嗯,对,就相当于有一个专门负责项目分析的角色,它会去搜罗项目信息,放到工作台上,然后其他人比如负责规划 plan 的,它需要的时候就去看一下,然后再来写入。

Founder Park:这个过程是你们手动给 AI 写的规则,还是它自主的行为?

李亚飞:应该是混搭的。一开始对项目进来的时候,它肯定会先分析,有一个 Agent 编排的过程。工作完之后它就转换成一种 pull 的模式,有人需要的时候它再调。

我觉得今天我们的 know-how 会在 multi-role 架构上进行改良。


07 

AI Coding 不是大厂的主赛道

Founder Park:如果别的公司也做 AI CDE,你的护城河是什么?

李亚飞:创业一开始就有一个 know-how,就是点子不要怕被讲出来。我们意识到这次的机会重大,欢迎更多人进来把这个赛道玩起来。只有一家也挺孤独的。就算 Cursor 100 亿了,那 Windsurf 也 30 亿嘛,这个市场非常非常大,可以一起参与进来,是好事。

Founder Park:他们把你们的份额抢了怎么办?

李亚飞:那就是甘拜下风,技不如人。如果你先发跑了一圈了,还被人赶上,那你确实不行,这个得认。市场就是这样。

但我相信,这对社会都有价值,而且你自己最起码能活在一个阵地上。今天这个事确实太大了。想象一下那个画面,一单五万块钱,一个不经传的外包公司,一年收入 500 万是正常的。那你想想全中国有多少个?

Founder Park:会担心那些大厂来做你们现在这个赛道吗?

李亚飞:大厂感觉还在忙着卷 IDE 路线,还是在传统路线。

第一,他们在真实的 CDE 方面倒没有太多积累。

第二,对于大厂来说,它也有两个问题:一,coding 不是它的主赛道,都是进来玩一下;二,它有一些「资源魔咒」在里面,需要非常强的 KPI 驱动增长,模仿可能是最好的方式。

Founder Park:为什么说 coding 不是他们主赛道?

李亚飞:我说的是国内大厂,对他们来说不是主航道。海外的话,我觉得同样能感觉出来一种「资源诅咒」的状态。他们迭代得不见得很快。如果说大厂实力应该是占据核心位置的话,微软就不至于让 Cursor 先跑出来,自己落在后边,迭代很慢。他们自己手握着 VS Code,想怎么整怎么整嘛。谷歌以前其实也有个代码托管工具,结果自己主动关闭了。可能他们的主营业务还是以核心业务为主导。

包括我们现在的合伙人阵容是非常非常强大的,know-how 很深。我们的产品经理就是中国最早服务大量程序员的,做过一个 freelancer 平台,非常了解软件怎么交付给企业。

真正 PK 的时候,是大厂里面的一个小团队来跟你 PK,它投了多少资源?实力怎么样?认知怎么样?他们有可能被老板赶鸭子上架,可能还要向我们学习。我们干了这么久的创业,对于商业 know-how 的整体认知肯定是更深的。

Founder Park:你们之前融资很顺利,拿到的都是非常好的 VC。现阶段的融资计划是怎么样的?

李亚飞:现在因为市场状态,是适合去提前起步的。只要我有先发优势,我就可以多拿一些资源。这样你比大厂拿到更多资源优势的话,其实仍然可以起来,Manus 就是个例子。每个时代都会有新的机会,新的优势,就是原创性的想法。我们今天可能就处在这个从非共识到共识的档口,所以在拿资源方面我们是比较 open 的。

Founder Park:如果现在拿到一笔钱,当下最先要解决的是什么问题?

李亚飞:Scaling 的问题,不是团队的 scaling,团队规模还好,更重要的是系统的 scale,就是支撑更多的用户,分布式体系的支撑。因为我们是一款标准的产品,很闭环,但是它背后有很深的 Infra 的东西,这个 Infra 需要花更多时间积累,也需要更牛逼的人才去参与建设。


08 

要成为 AI Native 时代的「程序员」

Founder Park:这两年做 AI,包括到现在做 ClackyAI,你觉得跟以前 ShowMeBug 时期最大的不同是什么?

李亚飞:上个阶段,我那时候还会承担一些技术上的活,写代码本身是个习惯。但今天的话,我们团队是带着我跑的状态。所以我反而可以把时间放出来,去做更多深入思考的事情。

比如我最近在思考,原来的技术架构从一把梭的 jQuery 时代,进入到了一个前后端分离的 Vue/React 时代。但是到了今天,我们看到一些趋势,又回来了一些,进入 AI 新全栈时代。这是不可忽略的变化。那 ClackyAI 能不能为这些新全栈的项目提供一个更简易的使用方式?也就是说,产品经理其实可以无代码地来用好这些架构,交付真正有用的产品。这是我们最核心的事情。

我需要去体感一下那些新框架是怎么回事,然后再传递给团队和市场。

Founder Park:可以有更多的时间去思考一些东西了。

李亚飞:对,我觉得这是个好的状态。当年美团之所以后来发展越来越好,也是大家把王兴的时间架出来一些,让他去强行思考,在拓展边界、各种竞争的时候做出几个关键决策,很重要。

Founder Park:感觉你现在状态还蛮好的。跟以前创业比,你感觉个人状态会有些变化吗?

李亚飞:我能感觉到市场的期待和压力,这些层面肯定都是存在的。但是如果你发现了这个点,然后跟团队共识得很好,我感觉会比较 enjoy 这个过程。不管发生什么,都可以很好地去应对。我们已经做好了最坏的打算,所以一切发生都是最好的,都是升级的过程。这可能跟上一阶段还是比较紧地去推动规划整个过程,不太一样。

Founder Park:不能 100% 在事里面,也不能 100% 在事外面。

李亚飞:对。其实原来那个时候可能弹药还更充分,但今天反而会更加从容。

Founder Park:最后一个问题。如果 AI Coding 已经是一个趋势,程序员应该怎么样参与到这个进程里?

李亚飞:现在的实际情况对初级程序员很不友好,因为没有企业需要初级程序员了。高级架构师发挥的空间还是比较大。大家看到这个肯定是焦虑的。但接下来会演进到一些新的阶段。

首先,仍然鼓励大家来学编程,技多不压身。只要这个社会底层还是程序写出来的代码在运行,不管是不是 AI 写,还是要去学的。但今天的学法会好很多。我们学习最难的是要闭环,代码怎么运行?出的什么结果?我最好看得到。最怕的是一大堆源代码,啥也不知道。今天,在这个过程中,AI 可以帮你。AI 写了个页面,你马上一看,新页面就出来了,那下次就会照葫芦画瓢。但以前基本不可能,这个过程会让你在初级阶段可以更好地跨越,成为一个原生 AI 时代的「程序员」。

而且,原生程序员可能不叫程序员了,我觉得叫「业务设计师」或者「逻辑设计师」这样的角色。你可能更愿意去理解需求,抽象这些东西,更加全栈一些。以前全栈需要一个人极强的学习力才能打通技术、学产品,但今天好像可以小小的、快速地进行跨界全栈,就够用了。

Founder Park:新的角色也会出现。程序员可能慢慢地一部分被归纳掉了,但是新的会出现。

李亚飞:对,新一代的,未来应该会出个更好的词汇,就像 Web3 一样。以后可能有一个新型的职业出来。


(文:Founder Park)

发表评论