
“你很难要求大家还没吃饱喝足的情况下,去做开源。” |
文|邓咏仪
编辑|苏建勋
如果说关于DeepSeek的讨论已经过于泛滥,开源也许是当下依然值得讨论的主题。
长期以来,在国内谈起“开源”,都会无可避免地陷入一种尴尬的语境。
它当然是理想主义的。“开源”背后的自由、开放特性,被普遍认为是互联网精神的外化——源代码向公众开放共享,且允许在遵循特定许可证条款的前提下,对软件进行自由使用、修改和二次分发。
最知名的开源项目“Linux”是操作系统的内核,催生了数以千万计的开源软件,这是互联网世界的根基。
但它的背后经常跟着一个问题:为什么要开源?怎么考虑开源之后的商业化?哪怕到DeepSeek爆火的现在,也很难有人给出完美的答案。
开源中国董事长马越,是最有立场谈国内开源历史的人之一,他在这条路上走了18年。
2008年,马越从硅谷回国创业,先是成立了“恒拓开源”——用开源软件帮助企业摆脱数据库、ERP等大型软件的束缚。
但很快他就发现,这种方案很难摆脱To B项目制的重投入,还很容易做成外包公司。
随后,马越选择收购“开源中国”这个社区,开始了一段曲折的创业路——“开源中国”经历过数度转型,从开源社区,拓展到代码托管、代码工具链,在探索商业化期间,经历了从母公司剥离独立发展,2019年被百度战略控股,最后,又在中美竞争、国产替代浪潮中决定重新独立发展,谋求上市。
做开源社区需要大量的资源、资金投入,在开源中国最艰难的时候,马越背负的个人债务最高达1.8亿元。
1972年出生的马越,有着一种老大哥式的坦率。他绝没有卖苦的意思,但你很容易从他的叙述中,体会到经历这些坎坷过后的幽默——他表示,在中国做To B就是“城市包围农村”,企业软件就是管理者智慧的固化。当中国的企业发展阶段还在初期,“你很难要求大家还没吃饱喝足的情况下,去做开源。”
但这些时刻都已经过去了。开源中国也已经摸索出一条更适合自己的、中国式的开源道路。
现在,开源中国已经成为全球第二大的代码托管平台,汇聚了超过1800万开发者。其自主研发的DevOps工具链已在金融、军工等关键领域,达到80%的市场渗透率。2024年,开源中国的营收已超过2亿元。
《智能涌现》获悉,「开源中国」近期正式完成数亿元C轮融资,由北京信息产业发展投资基金(北京信产基金)领投,深报一本股权投资基金(深报一本)及北京上河动量私募股权基金(上河动量)跟投。
至此,开源中国已累计获得超16亿元战略投资。
△开源中国董事长马越 图源:开源中国
马越认为,哪怕在全球范围内,开源也不是件容易的事情。他以GitHub举例:从2008年成立开始直到被微软收购,在2022年ChatGPT爆发后推出Copilot,才算是正式证明了商业化潜力。
“开源是强者和富人的游戏。”他说,上一代人都成长在物质更短缺的年代——商业社会也是如此,企业要先赚够了钱,才有余裕考虑是否开源,做一些人人为我、我为人人的好事。“吃饱了饭,才能有力气谈开源。”
这就不难理解,即使DeepSeek的爆火为全中国都打了一记强心针,马越的观点依然是冷静的。他认为,DeepSeek很难根本性改变国内软件生态的问题,这是一个时代的局限。
而想要在开源路线上有所成就,这要求新一代的开发者,从Day 1就开始出海,像DeepSeek一样去全球市场中竞争。
如果说DeepSeek改变了什么,更多的都是文化和价值观层面的事情。“十年前大家普遍不理解开源,觉得开源是一群草根做的事,现在全社会都能认识到,开源等于创新。”马越说。
以下为《智能涌现》与开源中国董事长马越的对话,经编辑:
DeepSeek不是国运级产品,年轻人才是
《智能涌现》:开源中国现在是第二大代码托管平台,国内最大的开源社区。DeepSeek的热潮,对你们的直观影响,是从什么时候开始的?
马越:就是他在App Store登顶那会儿。先是V3,然后是R1发布,一下子就火起来了。我们春节一直在加班,让DeepSeek首先能在中国生产的GPU上运行,这需要大量工作,我们是第一个在沐曦芯片上部署的。
我们都在调侃,春节就两件事:DeepSeek、哪吒。DeepSeek就是开源圈出了个哪吒。
《智能涌现》:现在已经形成了一种论调:DeepSeek是一个国运级的产品。但最近你的公开表达里,似乎对这一点不太认同。
马越:首先,大模型这个事情,你离不开英伟达吧?其次,你离不开Transformer架构;第三,你采用了蒸馏的思路,这些都不是国内原创的。
DeepSeek本质上是在现有路线上走得最好,实现了弯道超车,这是值得尊敬的。
但是DeepSeek能够不依靠外部资金支持,也不做任何PR,靠技术就能做到全球顶尖——以梁文锋为代表的年轻人崛起,这才是国运级的现象。
《智能涌现》:那什么才算国运级的产品?
马越:完全原创的技术创新。谁说Transformer就是算法的终局?如果有人用非Transformer方案做出比DeepSeek强十倍的成果,那才是真正的突破,那是人类级的进步。
《智能涌现》:DeepSeek给开源生态最大的启示会是什么?
马越:让全社会认识到:开源等于创新。
DeepSeek最令人唏嘘的是,在国内两年都默默无闻,也不如打广告的很多大模型公司,直到2024年开始,才因为技术,因为开源,被美国人超级关注——虽然一部分人特别支持,一部分人极力贬低,这种关注反而倒逼着国内形成了一种爱国情怀。
《智能涌现》:以前大家不相信这个观点吗?
马越:以前很多人认为开源就是一帮草根、乌合之众,很难和大厂这种正规军相比。
其实二十年前我就在说这些话:开源约等于创新能力,创新能力和国力是映射关系。正是因为我们有钱了、富足了,才会有DeepSeek这样的企业出现。
以前没人听,现在有人听了。
第二点很重要,就是要对年轻人保持敬畏。不只是尊重,而是要怕年轻人,信任年轻人。每一代人都有自己的时代使命,也有时代局限性。
《智能涌现》:这群年轻人,或者新一代开源贡献者,为什么能成长起来?
马越:这种质变是建立在之前充分的量变基础上的。
这十年要感谢走在前面的互联网大厂,事实上国内的主要开源力量集中在这些有实力的企业上。包括百度、阿里、腾讯等组织的开源项目,还有华为的鸿蒙、欧拉等等。他们都是领着工资的员工,在搞这些开源工作,不是纯粹基于兴趣。
《智能涌现》:DeepSeek证明一件最关键的事:通过底层技术突破,就能吸引大量用户,以及赢得尊重。
马越:现在我们国家最应该做两件事:一是牵头一起开发中国的CUDA;二是让所有国产GPU都能快速支持这些模型。
说到生态,生态就是要有更多的人参与,而且大家都有高度共识。现在最大的问题不是芯片卡脖子,而是CUDA这个生态的制约。中国完全可以开发一套类似CUDA的系统,就像我们有自己的GPU一样。
开源是富人和强者的游戏
《智能涌现》:DeepSeek爆火之后,找你讨论的人多吗?大家最关心什么话题?
马越:有人问我,DeepSeek会不会给中国To B市场带来新生机?不可能那么快。
IT外包的人天价格,20年来的涨幅还不如按摩师。现在外包人天均价一千就算高的了,还有五六百的。你去按摩,现在一小时都要一两百块钱。十年前,IT的外包时薪就比不上按摩了,现在差距更大,那是因为按摩价格涨得快。
中国软件没人愿意花钱,这是行业发展还不行的核心原因。要等这一代年轻人变成决策者,好时代才会来。
《智能涌现》:本质还是因为国内企业发展阶段还比较早。
马越:开源本质上是强者和富人的游戏。正是因为我们吃饱喝足了,才会有DeepSeek这样的企业出现。上一代互联网用户普遍不愿意为软件和知识付费,腾讯会议掉线了就重连,也不愿意买会员。
但这一代年轻人生活富足,你们会改变这个局面。
《智能涌现》:DeepSeek会给上一代To B创业者带来什么启示吗?
马越:我觉得他们给创业者带来两个重要的启示。第一是要对钱保持敬畏。创业的目的就是为了挣钱,谈理想和情怀没意义。
DeepSeek不太需要考虑商业化的问题,是因为幻方已经解决了这个事情。
上一代的软件创业者有个致命问题,一心想着烧钱,通过标准化产品打市场,这不是中国市场的运行逻辑,中国最有钱的金主都是大型企业,在中国想要赚钱,不做定制化是不现实的。
中国软件行业是城市包围农村,而美国是农村包围城市,腰部企业数量很多。
《智能涌现》:DeepSeek会改变大家对商业化的看法吗?开源怎么考虑商业化,是这个领域的“天问”。
马越:如果要开源做创业项目,技术必须得硬邦邦。就是和DeepSeek一样,Day 1就出海,否则在中国太难赚钱了,时代还不够成熟。
大家总是会举例,比如红帽那套模式也能商业化,但是想用这种方式在中国做一个上市公司,还不是这个时代的事。
《智能涌现》:你们自己也经历了很长一段商业化探索的时期,是从什么时候想明白要怎么做的?
马越:2020年是个重要转折点。我们那年决定从百度独立出来,重新谋求IPO。那段时间因为美国开始在很多尖端技术上断供,我们想抓住这个机会,真正成为一个独立的开源平台。
想要做真正的本土开源平台,必须要是彻底中立的第三方,这是选择重新独立发展的核心原因。
《智能涌现》:想明白之后,都做了什么?
马越:我们现在从社区发展出了三大产品线。
开源中国社区(OSChina)现在已经完全进化成一个AI教育平台。我们是中国最大的开源社区,有1000多万用户。现在我们24人的团队能创造约5000万收入,还有净利润,这在社区团队中很少见。
第二块是代码托管和研发效能平台Gitee,现在平台有3600万个代码仓库,服务36万家企业。主要提供代码托管私有化仓库服务,确保很多中小团队的代码安全,客单每年3000块左右。
从2020年到现在,我们已经能够提供DevOps 全生命周期国产替代方案,在满足开发者需求的同时,也建立起一个自主创新、安全可信的本土开源软件工具与生态。
第三块是AI大模型平台“模力方舟”,模型体验、推理训练到应用部署等等服务,都会提供。
《智能涌现》:为什么会从社区拓展到后来的DevOps,以及AI大模型基座?
马越:一个开源公司想要成功,靠社区是不够的,我们需要找一个闭环的商业模式,像GitHub那条路——社区、代码托管是没法达到这个目标的。GitHub也是在大模型浪潮来了之后,推出Copilot,才把营收做起来。
以后没有净利润的公司很难在国内上市,所以我一直强调看毛利率和人效,这两个指标高了,自然会有净利润。
《智能涌现》:你们现在的主要收入,来自哪里?
马越:我们主要收入来自100家左右的银行、券商、军工、制造业客户,都走大型私有部署形式。中小客户主要靠SaaS服务。
2024年我们全国订单超过2亿,是一个突破。前年过1亿,2024年翻了一倍,还实现了盈亏平衡,这很不容易。
《智能涌现》:主要模式靠服务大型企业的话,怎么避免走到项目制的老路?
马越:我们的产品做得很复杂,是因为中国的大型企业的场景复杂。我们的流程引擎、角色引擎、交互界面、流水线都是可定制的,还能做各种插件,就是为了保证灵活性。
我们会帮客户做定制化配置,但是不做二次开发。我们现在330多人,这块业务占200多人,但定制化去做开发和交付的不到10%。
第二是我们自己坚决不卖算力,只做第三方,比如给云厂商导流。
我们现在的路线很清晰:前端社区承载大流量,做开发者工具卖给企业,先To C,再To B,也算是一种产品驱动增长(Product-Driven Growth)的模式。
一起发展,比单打独斗强
《智能涌现》:是否选择开源,企业的考量到底是什么?
马越:现在大模型不开源很难。苹果为什么到今天iOS都不开源?因为硬件生态已经形成垄断。如果没有类似这样的护城河,你不开源,凭什么在市场立足?
就像我十几年来一直说的,开源是创新的最佳方法论,也是市场竞争的方法论,是反强权的方法论。你做得好,我们就开源来和你竞争。当年有Unix和Windows,就有Linux;有iOS,后来就有Android,都一样。
《智能涌现》:你做过很多并购,DeepSeek的成功会改变投资人对开源项目的看法吗?开源项目的出路会变得宽吗?
马越:这也是我想问所有投资人和创业者的问题:投资的目的是啥?到底你希望怎么赚钱?
上市、被收购、分红都是一种退出方式。但现在在国内,要么IPO,要么死掉,这很残酷。
中国的开源生态很分散,现在很多创业者缺乏一种共识,就是一起发展比单打独斗强。很多人把创业当作获取情绪价值的方式,就想当老大,宁可公司死也不愿意卖给别人。觉得卖了就是投降,这坎儿过不去。
如果放不下自己的ego,最终就会害了自己,也害了客户和投资人。
《智能涌现》:DeepSeek大获成功之后,你怎么评估现在我们所处的AI发展阶段?
马越:如果类比互联网那个时代,我们还是在大时代的开端状态,类似当年的拨号上网阶段。我从1997年开始上网,下载一张照片要四五天,网速只有28K。但即便如此,我们也觉得很神奇。
现在就像出海探索新大陆,所以创业者只要带着干粮上了船,不淹死,就一定有收获。
《智能涌现》:DeepSeek会怎么改变现在国内的创业格局?你觉得更利好大厂还是创业公司?
马越:很难说,可能还是大厂比较有优势。
首先,DeepSeek不是一个创业公司,人家不用外部资金就能买一万张卡,某种程度上也算个小大厂了。
我觉得DeepSeek给创业者带来两个重要的启示。第一是要对钱保持敬畏。创业的目的就是为了挣钱,谈理想和情怀没意义。
初创公司除非在算法、技术底层有突破,否则在工程层面,很难跟大厂拼数据,拼流量,这是最终商业化的两个要素。
《智能涌现》:现在的大模型初创的转向都很明显,方向聚焦,专心做底层技术。
马越:这就是开源的可怕之处。
我前年就说,预训练是大厂的游戏,创业公司应该做垂直领域的训练,把更多精力放在推理上,烧钱的事情本来就不该做。
历史上都有很多例子,当年开源领域有很多做容器的公司,比如Docker刚出来时只是各种容器运行时技术中的一种。结果K8s生态起来之后,任何容器技术只要实现K8s兼容性,就可以融入云原生技术栈,这种强大的生态整合能力最终使其它技术方案逐渐边缘化,相当于前边都白做了。
所以我给大家的建议,包括我们自己的策略,就是产品功能要紧跟随,但要轻投入,商业模式要做轻一点。
《智能涌现》:对开源中国来说,未来的目标会是什么?
马越:开源中国这十几年,积累了用户流量护城河,客户品牌美誉度,现在是通过信创找到了快速增长的收入模式。
我们在这轮融资之后,也会开始寻求进一步上市,希望成为A股人工智能开源第一股。
封面来源|AI生产






(文:智能涌现)