
Lovart 值得关注,它是 AI 应用层团队产品创新能力的印证和延续,这是 Manus 之后最火的 Agent,从通用领域,成功地向垂直赛道落地了 Agent 产品形态。
据了解,Lovart 发布后,推特上出现近 5000 条讨论帖,官方视频播放近百万,获得马斯克点赞、Grok 官方发帖讨论。24 小时内,waitlist 申请人数超过 2 万。
(一个使用 Lovart 制作的 Lovart 宣传片)
基础形态上,Lovart 看起来与 Manus 很像,一个能够调用工具的 Agent,替用户完成任务。
但 Lovart 在垂直领域更进一步,它把一种需要多模态的「职业」变成了工作流再内化成 Agent,配以适合设计师使用的产品形态——画布。「画布」就是「桌子」,还原到设计的原始状态,没有电脑,只有笔和纸,一个人有需求,一个人有能力,好的设计作品在这个场景中诞生。
「Lovart 现在当然是一个工具,但以后呢?它会是一个有职业属性的人,直接交付服务的结果。」
Lovart 创始人 & CEO 陈冕在 AI 设计领域有很多实践经验,他认为图像生成的 AI 产品,其实已经走到了第三个阶段。
1.0 阶段,Midjourney 等产品,图片生成的单点能力直接产品化;
2.0 阶段,ComfyUI 等工作流产品,点连成线,多种模型能力的链接,AI 能做到更多图片创意的任务;
3.0 阶段,Agent,如 Lovart,让 AI 参与工作流的规划和执行,进一步降低用户门槛。
创作工具正在不断简化,ComfyUI 的高门槛拒绝了很多创作者,但 Lovart,至少这是第一款让我们的专业设计师在看到之后想要第一时间尝试的产品。
在 Lovart 发布后一天,我们与陈冕做了一次对话,Lovart 是如何诞生的?它背后有着怎样的思考?在这篇访谈里都可以找到答案。
创始人信息:陈冕,本科毕业于东南大学,曾任职于摩拜担任产品总监,曾是字节跳动剪映、CapCut 全球商业化负责人。
采访 | Nico
编辑 | Nico、夏天
Founder Park 正在搭建「AI 产品市集」社群,邀请从业者、开发人员和创业者,扫码加群:

AI 图像产品的三个阶段
Founder Park:Lovart 是一款受到 Manus 启发的产品吗?
陈冕:我很感谢 Manus。创业圈子里,很多前沿的公司,大家的认知其实是相似的。但在一件事情没有发生的时候,你虽然有认知,但将信将疑,不是百分百的笃定。直到一件事火了之后,才能形成群体共识。
群体共识会加重你对这个认知的笃定程度。我们在 Manus 发布前就在做 Lovart,不然也不可能在当下非常快速的做出来。坦白讲,让我们激进地去准备、觉得方向确定的时刻,还是在 Manus 火了之后。
但是最终,潜意识释放出来后火了,其实是被大家共识了,是时代在呼唤这个产品。那个时候我们也非常兴奋,那就证明 something right。
创新就是这样,大家最开始其实都是在长夜里凭着自己的认知一点点往前走,但是是将信将疑的,但随着越来越多的产品出来,这个信念会变得越来越笃定,这条路也会变得越来越共识。所以,真的还是挺感谢他们。
Founder Park:Lovart 是一款 for everyone 的产品,还是一个 for designer 的产品?
陈冕:我们做的是一个垂类 Agent,不是通用 Agent。大公司有强大的技术和流量优势,不想陷入对抗性竞争,要走创新的产品竞争,通用 Agent 当然是 for everyone 的,大公司会更倾向于 for everyone,因为这显然是更大的机会,但对创业者而言,挑战非常大。
张一鸣之前提到,创业进程里,认知最重要。我感同身受,现在 AI 创业就是「认知领先 + 极致执行」,就是拼命执行,非常迅速地执行是最重要的。谁能做出第一个创新的产品,这对创新公司来说是很重要的。
Founder Park:Lovart 这款产品是如何做出来的?为什么想做这样一款产品?
陈冕:从我们的经验来说,设计、图像生成这类的产品(甚至也可以迁移到 LLM 产品)存在三个发展阶段。
1.0 阶段:内容生成,即单一的内容生成。最开始大家使用的是 Midjourney、Stable Diffusion,国内有 Liblib。这是最开始的第一波浪潮,那时大家使用 Liblib 是通过 WebUI,本质上还是在进行生成,这是第一个时代,我们称之为 1.0 时代。
2.0 阶段:工作流。Coze、Dify,以及许多其他产品,实际上都在构建工作流。图像领域也是如此,很快,您会发现大家开始使用 ComfyUI,更复杂的工作流则通过 ComfyUI 来实现。这里存在一个巨大的变化,在图像这个领域,WebUI 和 ComfyUI,尤其是在中国,这两款产品实际上是应用范式变化最有代表性的例子。它背后代表的变化是,AI 最终目的是帮助人完成一连串的工作。因此,这项工作的第一步,或者说原子单元,是一个一个的生成能力,或者说生成工具,亦或是传统工具。最开始是这种生成能力被创造出来,所以大家可以将生成能力作为其工作流程中的一个工具来使用,把这些工具串起来做成一个工作流,就能取代原有工作里更大比例的任务了
3.0 阶段:Agent,我们将 Agent 定义为由 AI 规划并执行工作流。因为(Claude 等)模型能力提升,AI 就可以串联所有的工具和工作,并执行出来。人只需要向 AI 发指令了。
这个认知并非我们最初做 AI 创业时就有的,这是对整个 AI 应用的通用认知。一开始大家只做 AI 生成(比如图片、视频),后来出现工作流形态,这背后是因为每一个引领时代的产品都做对了某件重要的事情。
Founder Park:3.0 的产品,比如 Lovart 和 Manus,现阶段用户价值还没有闭环,为什么要选择一个还不成熟的产品形态?
陈冕:Lovart 这个产品也是基于我们的一些认知与判断,当然现在也有很多人觉得 Agent 并没有那么成熟,坦诚讲,Agent 确实没有那么成熟。但如果等 Agent 真的成熟了,那就不是创业者的机会了,尤其不是应用创业者的机会了,因为应用创业者本身并不掌握模型。在应用层创业,认知领先非常重要,在模型没有那么成熟之前,就应该想到未来的方向。
当群体的潜意识被共识了,这是件很有意义且有成就感的事情。这也是我觉得应用创业者就应该这么去做的事情,因为当你不掌握模型,也不掌握流量时,最大的创新就来自于认知。
Founder Park:最近有一个观点,对 AI 创业者来说,现在出来和两年前出来是一样的,因为产品形态发生了颠覆,之前的积累可能没什么价值。
陈冕:我不认同。在我看来,认知是累加的。没有经历 1.0、2.0、3.0 时代,无法如此顺畅地想到这个过程。Manus 也是一样的,Monica 就是它的 1.0 时代。所以这个认知是在大家的摸索当中,随着技术趋势的明朗、技术路径的共识、技术能力的成熟,大家逐渐形成的共识。
还原设计最原始的样子
Founder Park: 在 1.0、2.0、3.0 阶段,你们是如何积累有价值的经验?对业务和产品有什么帮助?
陈冕: 针对设计这个垂直领域,我们在思考一件事:AI 时代的交互范式或方式应该是什么样?大家有很多讨论,比如 Language UI、是否需要 GUI 等等,讨论非常多。在这方面,我们也有一个关键判断,交互在不同的垂直领域和场景下,应该有所区别。
举个简单例子,我们现在面对面访谈,互相对话是个场景,有其对应的交互方式。在跟设计师聊设计,光说话可能不够,得有人在设计屏幕前指指点点,经典甲方场景。所以我们想,如果 AI 成为「人」,终局交互不能只靠对话,这是我们创业第一天就想明白的。不同垂直场景,需要不同界面和交互。设计这种视觉传达、视觉对齐很重要,所以需要屏幕和手势完成和视觉的对齐。
在 Lovart 产品里的体现成「画布」。Lovart 左边画布,右边对话框,就像设计跟老板/甲方对话时,旁边就是屏幕,鼠标是老板的手。基于这个点,我们思考我们应该做什么?是不是应该早点做画布?所以我们在画布能力和工具方面做得比较早,也花了不少力气。
画布本质上可以说是屏幕,但抛开屏幕,本质上如果现在我们把所有科技的东西都去掉,如果人类回归到笔墨纸砚,画布就是桌子。现在我们两个人在做设计,甲方站在你旁边告诉你要做什么,你把作品放到桌子上,ta 对着桌子指指点点。所以桌子上不应该是 ComfyUI 或者之前的一些工作流产品。
桌子上是作品,能够拖拽指点,这是最原生的交互方式或者界面。虽然工作流产品看着像在 canvas 上,但实际不一样。我们的 canvas 本质是桌子,盛放作品,最自然的交互就是指着作品说修改。这是我们垂直领域最初认知,所以我们才更早积累画布能力和 Edit。

(来自 Founder Park 同事的实际体验)
Founder Park: 还原设计这件事最原始的样子,这是一个很有意思的思考,但它如何通向「有用」的 AI 产品?
陈冕:回到你前边问的问题,我们为什么不 for everyone?
去想最原始的样子,人在桌子上做三件事:涂抹、裁切、拼贴。AI 诞生后,像旁边多了个甲方(用户)指挥 AI。理想情况是甲方指挥 AI 完成所有任务,这时才能 for everyone。但这需要模型能力很强。如果不够强,就会出现用户说「你做不好,我自己来」的中间状态。
所以你会发现,桌子(画布)需要在,桌子旁的传统工具箱(Edit)也要在。因为用户有时发现 AI 做不好,就会推开说「我来」。所以现在本质是 Agent + 桌子 + Edit。桌子放 AI 产物、支持修改,也承载传统 Edit 能力,那能力在桌子旁的工具箱。旁边多出的那个人就是对话框。所以对话框、桌子、工具箱,这是合理且一直存在的形态,也是我们想做的。
那设计何时能 for everyone?当模型智能强大到不再需要那个工具箱,用户通过对话、指点就能完全满意,不会自己上手时,就可以 for everyone 了。
但 Edit 能力是面向专业消费者的,普通人用不了工具箱。所以工具箱还在,设计师就会还在。当工具箱不需要了,没有用户自己上手的瞬间,设计师可能会失业。但设计师的核心价值——创意、对人类共鸣的洞察,AI 目前无法取代。
AGI 也许能取代,但这对社会的冲击会很大。至少现在,我认为 AI 只能模拟理解感受,无法真正洞察人类共鸣的情况,所以艺术家/设计师的意义就在此。产品能 for everyone 是未来的事,这是我们现在的认知。所以我们现在不想做一个 for everyone 的产品,而是做 for Prosumer 的产品。我们希望成为设计师的朋友,因为我们认为最终设计师的本源是创意,在于对人类潜意识里对共鸣的渴望的洞察,这是他们不可替代的价值。所以我们做的其他事情,是希望能让他们 focus 在创意之上,把其他琐事交给 AI,给他们插上翅膀。我认为这是 AI 在现阶段的意义。
Founder Park:图像领域一直有一个艺术相关的问题,比如更好更高效的 AI 工具,是否在加速前沿艺术风格成为大众审美的这个进程?比如很经典的,梵高的作品直到他过世后才受到认可。
陈冕: 我觉得这不一定会发生。一个艺术风格,艺术家常常在其身后才被广泛推崇,有时是因为他们对群体感受和潜意识的洞察过于超前,这需要整个社会周期性的变化才能跟上。这种变化是深层的,与社会发展密切相关,我认为不会因一个工具的出现而根本改变。我们现在做的,是把工具还原到它应有的形态。
在不同的时代,工具形态是不同的。在纸媒时代,没有电脑,桌面摆满了手稿,这是当时的「桌子」。在电脑时代,设计师亲自动手,Photoshop 带着画布和各种工具出现,那就像当年的桌子。而现在,当人越来越成为甲方,AI 成为乙方时,这个「桌子」应该是什么样子?这是我们非常感兴趣,也是我们从 day one 就在思考的问题。Lovart 是我们目前给出的答案。
Lovart 会成为一支「创意团队」
Founder Park: 现阶段这款产品,您提到它并非百分之百完美,它欠缺哪些方面?
陈冕: 欠缺的地方很多。
Agent 的能力不够强,我们期待基础模型能更强大,这样我们的产品也会更厉害。我们需要 leverage base model,而不是被其取代,这是很重要的思考。你的核心价值应该在基础模型之外,才能真正利用它。如果你的工作只是为基础模型现阶段的不成熟打补丁,那不是利用,是在对抗,这样做是「找死」。
当然,产品自身也存在许多 bug。最近因为关注度高,很多人反馈邀请码问题,这确实是我们的不足。核心原因有两个:首先,我们采取的是小范围用户先行体验、收集 bug、迭代后再开放下一批的策略。在 bug 修复完成前,不宜大规模开放,这是最主要的原因。
其次,坦白说,我们也不可能无限量地发放邀请码。很多用户也能理解,这涉及较高的成本。目前我们的邀请码是纯免费使用,确保用户体验,但这背后是有运营成本的。好在图像领域,token 成本问题相对其他领域还没那么严重。所以我们目前的成本并不是非常高,但确实也不低。我们非常有信心能尽快实现公开使用。
开发 Agent 的过程非常有趣,AI 真的有自己的「想法」。正如 Manus 主张的「less structure, more intelligence」,我们非常认同这一点。因为在与 Agent 调试时,你不能把指令说得过于死板,那样反而会限制其智能。这和人一样,只告诉它按步骤 ABCD 执行,它反而可能变笨。你需要告诉它目标是什么,它在中间过程会展现自己的思考。比如,我们有时会告诉它,用某个基础模型的图像工具换脸效果不好,应该改用我们内部专门用于真人 face ID 的工具。但有时它并不这么认为,它会有自己的判断。
Founder Park:你会把 Lovart 定义为工具吗?
陈冕: 当然,它首先是一个工具。但你可以理解为,它现在是工具,未来可能演变成一种「人」、一种「职业」,或一种服务。这也是 AI 带来的变化。一个非常有意思的商业命题是:我们不能沿用工具时代的思路来理解 AI 时代的工具。SaaS 的本质是服务由人提供,是人使用工具。而现在,AI 成为提供服务的主体。这里的商业价值巨大,本质上是对特定职业生产效率的提升甚至替代,是对生产关系的重构。所以这是一件令人振奋且意义巨大的事。尽管国内投资人过去在工具类项目上损失惨重,但我认为对 AI 领域的投资应更乐观。
Founder Park:未来产品能力和功能会有哪些预期内的更新?
陈冕: 我们还有很多想要实现的功能,坦诚讲,目前上线的功能只是一部分。大家能想到的许多功能未来都会有。比如当天晚上已经接入了 3D 的展示。现在用户可以一句话生成视频,甚至配上音乐和配音。未来,用户可能只需一句话就能设计一个 3D 模型手办,我们正在开发这个功能,很快就会上线。这些都是我们希望在正式发布前完成的功能,所以我们还在整合更多能力。
Founder Park: Lovart 有图片、视频,以后还会有 3D 和音频,它最终会变成什么?
陈冕: 它会是一个融合了设计师、导演、摄影师角色的存在。很难用单一职业概括,你可以把它当作一个未来的「创意团队」,设计团队或创作团队。这个团队内部有 Multi-agent 协作完成任务。这件事情的本质上解决的是 creation,所以它是一个 Creator team。
Founder Park: 设计师、导演和摄影师,为什么不是三个独立的产品?
陈冕: 用户作为甲方,需要的是整合的服务。从这个角度看,这款产品也可以被视为一家「设计公司」。
有了这些不同的能力(工具/Agents)之后,还需要一个「领导者」,对吧?负责调度的就是领导者,最聪明的模型需要负责调度这些工具,它必须知道每个模型、每个 Agent 的能力边界。最终人扮演的就是甲方角色。最终,人是甲方,提供最关键的创意。甲方依然非常重要,需要满足人的需求。所以从这个角度看,尽管它提供服务,但也可以被称作一种工具,因为它最终还是为了满足人的需求而出现的。
当然,如果未来 AI 真正有了自主意识,自主创造,那太 crazy 了,等 AGI 实现了再说。我们本质上做的还是我们觉得在前 AGI 时代该作为一个工具,或者作为一种服务,作为一种新的职业,它应该具备什么形态和功能。
Founder Park:过去所有主流的图片产品(如 Canva、PS)、视频产品(如 PR、剪映)以及音乐产品,都是相对独立的,并且通常针对不同人群收费。您怎么看?
陈冕: 其实它们都不是完全独立的。Adobe 有图片、视频、音频产品;Canva 也有图片和视频;剪映有视频,其姊妹产品「醒图」针对图片方向。你会发现任何一家公司基本都会覆盖图片、视频,甚至音频领域,只是切入点不同。
它们确实不是同一个产品,我理解你说它们分开,是因为用户在不同场景下使用。但你想,人类在创作过程中是需要在不同产品间切换的,先用修图软件处理图片,再导入视频编辑软件,可能还需要其他软件处理音频。现在,这项切换和整合的工作由 AI 来做,但背后仍然调用了许多工具。比如在 Lovart 中,AI 会调用 Kling、GPT image、ElevenLabs 等底层工具。工具层面是独立的,但使用者是 AI,它在一个统一界面下完成。最终人是甲方,需要的是一个整合了这些工具成果的作品。所以我们认为,在创意领域,必然会涉及各个模态和品类。
关键在于,这款产品最终是否融合成一个整体,要看用户最直接接触的界面是什么样的。如果用户仍然需要手动在各个工具间切换,那就是分离的产品。但现在,这个负责「切换和调度」的角色由 AI 担任,用户只需与这个 AI 交互。这个 AI 在后台调用各种工具,那么产品形态自然会是统一整合的。
Founder Park: 核心是交互方式改变了。以前是人直接操作工具,需要切换,现在是人与会用工具的 AI 协作。
陈冕: 对,但是你现在面对的是 AI,而 AI 面对的是多个工具,这是不同的。你可以因此获得一个团队、一家公司,比如一家设计公司。所以 AI 的可怕之处在于,它从最初取代工具,到可能取代个体职业,最终取代的是具备协作能力的团队,这才是最 crazy 的。
Founder Park: 过去一些产品未能完全融合,部分原因可能在于其多采用订阅制的商业模式。
陈冕: Canva 在融合方面做得很好,一个会员账户可以通用整个产品线。我认为 Canva 已经相当融合了。Canva 有视频功能,而且有很多视频模板。比如我们为 Canva 付费,可能是为了制作海报或公众号配图,只需为此付费,它也能支持团队协作,每月也就几十块钱。回到 Lovart,产品未来肯定会商业化,一定会用订阅制的方式。当前 Lovart 主要面向的是海外市场。
Founder Park:针对商业模式,国内用户更倾向于免费产品,你怎么看订阅模式不会是中国 AI 主流商业模式的观点?
陈冕: 我不认同这个观点。中国人愿意为服务付费,为最终结果付费,只是对纯粹的工具付费意愿较低。所以关键在于 AI 最终是工具、服务还是结果?这取决于模型的智能程度。我们认为 AI 最终会成为直接交付结果的服务,因此中国用户会为此付费。这是对未来的预判,当下我们先从海外市场开始。
Founder Park:Lovart 目前还没上线付费功能,未来会推出吗?
陈冕: 是的,我们现在可以说是字面意义上的「在燃烧」资金。我们亏不起。
Founder Park:大概什么时候会上线付费?
陈冕: 应该会在几周内。(笑)主要等 Bug 修复得差不多了就会上线。
Founder Park:Lovart 上线后,会有一个核心的「北极星指标」吗?比如用户粘性、数量、留存率等,您最看重哪些?
陈冕: 我想这方面的衡量标准大家是趋同的,最核心的还是用户是否愿意为产品付费,以及付费后的留存率。
我们团队没有产品经理,
只有设计师
Founder Park: Lovart 最核心的是理解用户意图,并将其拆解转化为 AI 的执行流程。在使用 AI 和大模型完成这件事的过程中,有什么经验或感悟吗?这对于公司而言是全新的探索,因为之前的业务似乎没有太直接相关的经验。
陈冕: 对公司来说,这当然是全新的体验,因为我们之前没有 Agent 产品。如何与 Agent 协作和打交道,我们也是第一次。它们确实有自己的「想法」。所以在这方面,我们都还在持续摸索。不过,我们公司有很多设计师,他们觉得这个过程很有意思,因为某种程度上他们在「教」AI 如何进行设计。
本质上就是将人类的设计 know-how 传达给 AI。我们团队里不少同事有美术或设计教育背景,他们以前教学生,现在教 AI。AI 的「智商」不低,但有时又难以完全掌控,我们开玩笑称 AI 为「小朋友」。这就是目前的工作状态。这里可以简单理解为将设计领域的知识和流程融入到模型训练和 Agent 逻辑中。
这个过程很有意思。我是产品经理出身,但我认为,未来的通用型产品经理没什么用。我自己也有十多年的产品经验,经历了移动互联网的完整周期。我认为未来的产品经理,其核心价值更多在于行业知识深度,在于将特定行业的 Know-how 体系化地教给 AI。因此,产品经理的角色将更加分行业、分垂直领域。我觉得通用互联网产品经理是个很危险的职业。
Founder Park: 为什么说产品经理很危险?
陈冕: 通用型的 Agent 未来被基础模型内化的可能性很高。我认为未来真正能实现百花齐放的,是专注于垂直应用的那些 Agent。这些垂直 Agent 的核心竞争力在于其背后蕴含的垂直领域专业知识。对于上一个时代的通用互联网产品经理,我确实觉得其定位有些模糊了。
Founder Park: 从职业发展角度看,它可能会演变成一种高度专业化的角色。
陈冕: 对,如果通用能力被模型底层吸收,只需要最强的那几个人就够了。
Founder Park: Lovart 现在对相关职位的称呼已经不是「产品经理」了吗?
陈冕: 在我们团队,产品经理没什么用。
当工具足够智能,「管理需求的人」不再被需要,但「定义需求的人」反而更重要。把产品交互设计成「画布」,本质上是在回答一个问题:AI 和人类如何共享同一张桌子?
答案很明确——AI 坐在执行端,人类坐在创意端。产品经理曾经是两者的桥梁,但现在,AI 直接听懂了设计师的语言。所以我们团队没有产品经理,只有「教 AI 的人」。
Founder Park:这听起来有点悲观,仿佛我们在让设计师们把他们的行业经验教给 Agent,而这些 Agent 最终可能取代设计师。
陈冕: 不,我们始终强调我们是设计师的「朋友」,你刚刚讲的「取代」是无法对抗的,关键在于如何看待它。AI 确实极大地解放了生产力,同时也可能让顶尖设计师的思维模式变得更平权。换个角度看,以前的顶尖设计思维,只有找顶尖设计师才能获得,服务很贵。现在,这种高质量的设计可能变得「For everyone」,而且成本大幅降低。问题在于成本降低后,那些依赖原有模式生存的人怎么办?这确实会引发生产关系的调整。但这属于社会层面的问题,交给时代去解决吧。
Founder Park:对于设计师和产品经理这两类人才,我们在公司更看重哪些特质或画像?倾向于招聘什么样的人?
陈冕:在我们公司,我觉得产品经理没什么用,设计师才有用。这是基于我们专注于设计这一垂直领域而言的。我们所有的产品迭代和案例积累都围绕着设计师的工作流和需求进行。
Founder Park: 两种人,一种具有深厚设计功底的产品经理,另一种原本是设计师但转而承担产品经理职能、之前没有典型产品经理经验的人,更倾向于哪种?
陈冕: 倾向于后者,原本是设计师,后来在公司内探索并承担部分产品定义职责的人。
为什么有数据的 GitHub,
代码工具不如 Cursor?
Founder Park:您刚才提到产品能力的提升依赖基础模型,比如 GPT-4o 的图像能力。GPT-4o 的图像 API 发布对 Lovart 有很大影响吗?如果没有 4o 的图像能力,Lovart 这样的产品是否就无法存在?
陈冕: Agent 的核心能力取决于模型对工具的调用和规划能力。Agent 的能力才是本质。即使没有 4o image,Agent 也能存在,只是效果可能会打折扣。
因为很多语义理解、图像内容一致性等问题,确实需要依赖更好的图像模型来解决。所以可以理解为,GPT-4o 在图像模型能力上带来了显著提升,但它并非 Agent 能力本身。我们同样也期待 Claude 4 以及国内如 Qwen 等模型的进一步迭代。我们也希望能有非常好用的国产 Agent 能力。
Founder Park: 两年前大家热议 Midjourney,最近却没什么声音了,你怎么看?
陈冕: 这是产品从 1.0 向 2.0、3.0 的演变。Midjourney 在语义理解和解决部分工作流问题上表现出色,但它仍然是 1.0 产品。现在市场已经进入 3.0 阶段了。
至于 Midjourney 团队,我感觉他们可能志不在此。
Founder Park:社区型产品其实比工具型产品有更强的用户粘性,所以剪映、WPS 会有模板创作社区,Lovart 这样的产品会有类似的形态吗?
陈冕: 不,我认为工具和服务的用户粘性是非常强的。如果一个工具粘性不强,那只能说明它不好用,或者使用成本太高,时机未成熟。工具的粘性非常强,它不是针对所有人的高频消费品,但专业人士会频繁使用。就像刚提到 Canva,做营销的人群中其使用比例很高。不求天天用,但求有需求时能用且好用,我觉得这就足够了。所以用户是否持续使用,本质还是取决于使用成本、体验和能否切实解决问题。这不是靠社区能够解决的问题,这样做是 make sense 的。
要做社区,就专注做好社区。要做工具和服务,就专注做好工具和服务。如果工具或服务没有用户留存,那只能证明工具或服务本身没做好,而不是其他原因,除非服务本身的使用频率就极低。但我们做的不是这类,我们不做普通用户,是因为普通用户的创作需求通常非常低频,比如仅仅是为了社交分享,他们在微信、抖音等平台使用内置 AI 功能即可,没必要使用我们的产品。我们选择做垂直领域,所以,虽然刚才讨论了通用与垂直,但我们实际上已经选择了垂直领域。坦白讲,做通用产品我们也竞争不过大公司。
Founder Park:工作流数据能带来更好产品体验吗?比如 GitHub 拥有大量代码数据,也在做工具,但似乎在与 Cursor 等竞品竞争中并未完全体现数据优势。您觉得 Lovart 从 1.0/2.0 时期积累的数据优势体现在哪里?
陈冕:我觉得 Cursor 才具备数据优势,因为 GitHub 的代码能力大部分已经被 Claude 等底层模型内化了。GitHub 基于自身数据做工具就没有绝对优势。代码能力被底座模型吸收了,代码数据就不再是独有优势。而 1.0 和 2.0 的数据之所以有意义,在于它们记录了用户如何运用 AI 工具、如何结合 AI 与传统方法进行创作,这是非常有价值的。ComfyUI 的工作流本质上是将各种模型和传统功能模块堆砌起来。
这些工作流数据是 AI 需要学习的,而底模在这方面是空白的。对于 Cursor 来说,知道哪些代码应该用 AI 写,哪些应该手动写,这部分知识很重要,但后来者可能难以准确获取。这就是区别所在。
Founder Park:你们会考虑自己开发模型吗?这是很多 Agent 公司都会面临的问题。
陈冕: 现在不会。这取决于如何定义「做模型」,是完全从预训练开始,还是强化微调。目前我们不会做完整的模型开发。
Founder Park:您认为现阶段的 Agent 产品,是否需要将 workflow 等用户行为数据用于训练模型?
陈冕: 是的,可能需要通过 SFT 或更进一步的强化学习来进行训练。RL 是必须做的。
Founder Park:考虑到设计领域有很多团队在探索,我们会思考,面对这些竞争,我们的核心差异化优势在哪里?
陈冕: 差异化不是看了市场上有哪些产品、发现别人没做什么才去做的,那样反应就太慢了。真正需要思考的是,你自身的优势是什么?在规划要做的事情时,要想清楚这需要哪些关键能力,其中哪些是你的核心优势,并且这个优势目前还没有被其他团队充分利用。基于自身优势去寻找市场机会,这才有意义。所以核心并不是简单地看竞品有没有做什么。
当然,看到市场上有竞品,发现某个点他们没做到,我们去填补,这一定。但有时如果认知不够深入,可能会发现没人做某个方向是有原因的,比如它需要某种特定能力而大多数团队不具备。但如果你恰好擅长某方面,那么我认为无论何时进入,只要想清楚了,并且确信自己能做得比现有方案更好,或者您认为别人做得不如你,那就可以去做。
我认为很多时候,创新与团队自身的特质和核心能力紧密结合,会更有竞争力。比如我们的竞争优势,也是从一开始就基于我们自身特点考虑清楚了要做什么,才朝着这个方向前进的。如果说先去研究竞品再找差异点,我觉得这种思路是滞后的。
竞品分析是产品经理的工作,想清楚目标才是创业者的工作。

(文:Founder Park)