十道灵魂之问,十日谈解读 DeepSeek 的“国运级创新”!

栏目 | AI 进化论十日谈

出品丨AI 科技大本营(ID:rgznai100)

新年平地一声雷,DeepSeek 炸醒了沉寂已久的 AI 圈。这个“低成本”、“高性能”、“真开源”的国产大模型,不仅硬刚 OpenAI,更引发了一场关于 AI 未来走向的深度思辨。

Scaling Law 是否过时?开源生态如何构建?大模型护城河究竟在哪?哪些行业将被颠覆?程序员是否面临失业危机?面对 AGI 浪潮的滚滚而来,我们不禁要追问:AI 的进化之路,将通向何方?这些 “灵魂拷问”,直击当前 2025 AI 圈最核心的焦虑!

为了解答这些问题,CSDN 特别企划「DeepSeek 暨 AI 进化论十日谈」系列直播。本期为十日谈系列直播之第四讲,CSDN 高级副总裁、Boolan 首席技术专家李建忠对话北京大数医达创始人 & CEO、复星集团首席 AI 科学家邓侃,两位 AI “老炮儿”火力全开“硬核”对话,围绕十大犀利议题,分享最前沿的认知干货。


DeepSeek 之后,还要不要相信 Scaling Law,要不要囤卡“大力出奇迹”?

李建忠:DeepSeek 的出现,确实给 Scaling Law 理论带来了一些新的思考。我认为,虽然预训练模型的 Scaling Law 可能会因为数据瓶颈和模型集中化而放缓脚步,但在推理计算领域,Scaling Law 依然拥有广阔的天地。随着推理需求的井喷,未来推理侧的算力需求占比甚至可能远超预训练。

所以我的结论是,DeepSeek 之后,我们真的不需要再像过去那样,为了预训练而大量囤积英伟达 GPU 卡了。未来的算力需求将更加多元,除了英伟达,像AMD、Intel、谷歌 TPU 等多种算力方案都将在推理市场分一杯羹。

邓侃:完全同意,OpenAI 那种“大力出奇迹”堆算力 Pre-training 模式,确实要被 DeepSeek 这样的创新模式所打破了。

我更想补充的是,Training(训练供给侧)的问题要细分来看:首先,星际之门 Stargate 那样的超大算力项目,可能不再是 AI 发展的唯一答案。其次,未来的智力涌现可能更多地发生在 MoE(Mixture of Experts)模型的 Experts 局部,而不是仅仅依赖模型规模的无限扩张。

最后,MoE 架构实际上为小企业参与大模型 Training 打开了一扇窗。未来,小企业完全可以作为 Expert 模块,融入到大厂的大规模模型训练中,就像 Midjourney 与 Niji 的合作那样,小厂也能在大模型时代找到自己的位置。

强化学习驱动的推理计算范式转移之后,数据还是否重要?

邓侃:对于这个问题,我的答案斩钉截铁——数据永远重要,但我们需要重新定义“数据”的概念。在我看来,对于任何一家严肃的大模型研发机构,全互联网数据仍然是基石,DeepSeek 这样的公司已经帮我们完成了全网数据的初步清洗和整理。中小企业可以站在巨人的肩膀上,通过蒸馏 DeepSeek 等大模型,快速获取高质量的精选数据。更重要的是,AI 生成的数据正变得越来越有价值,这些数据是互联网原生数据的一种提纯和升华。展望未来,IoT (物联网) 数据将是下一座金矿,例如特斯拉的驾驶数据、城市监控数据、各类传感器数据等等,都蕴藏着巨大的潜力。

李建忠:数据不仅重要,而且会越来越重要。我想补充的是,未来的数据竞争,将聚焦于两个关键点:

  • 一是环境中的过程数据,而非仅仅是静态的历史数据。例如,在软件工程大模型的训练中,程序员写代码的过程数据,Issue 数据,比最终的代码结果更具价值。

  • 二是数据质量。互联网数据固然海量,但真正能喂饱 AI 的,是各个领域的高质量、专业化数据。正如 DeepSeek 在数据质量上投入了巨大精力,甚至传言说创始人梁文峰会亲自下场标注数据,足以说明数据质量的重要性。

DeepSeek 的赶超到底是雕虫小技?还是国运级创新?

李建忠:DeepSeek 的横空出世,绝不是什么 “雕虫小技”,而是一场生态级的创新,甚至是国运级的创新。在我看来,DeepSeek 的意义至少体现在三个层面:

  • 首先,它和 OpenAI 的 o1 模型一起,引领了 AI 范式的转移,从预训练走向了推理计算,而且 DeepSeek 的开源,加速了强化学习技术的普及。

  • 其次,DeepSeek 的开源本身就是一种生态战略,它将倒逼整个大模型生态的建设,包括算力生态、应用生态、Agent 生态等等。

  • 最后,也是最重要的一点,在全球技术竞争的大背景下,DeepSeek 的突破,无疑具有国运级的战略意义,它极大地提振了中国 AI 行业的士气,甚至惊艳了世界。正如饶议教授所说,DeepSeek 的意义堪比“自鸦片战争以来,中国给西方技术界带来的最大震撼”。

邓侃:如果用“国运级创新”来形容 DeepSeek 的突破,我认为毫不为过,甚至恰如其分!我从四个方面来解读 DeepSeek 的“国运”意义:

  • 第一,DeepSeek 的成功,是对美国技术霸权的有力回击,堪称“反围剿”的胜利;

  • 第二,DeepSeek 的开源和低价策略,团结了全球开发者,甚至包括欧盟、日韩等,这简直是一场“反霸权”的统一战线;

  • 第三,美国的制裁,或许会倒逼中国加速 GPU 国产化,最终实现“集中力量办大事”的壮举;

  • 第四,外部压力反而可能催化中国 AI 产业链的快速成熟,构建起自主可控的 AI 生态闭环。我对中国 AI 的未来充满信心,DeepSeek 的出现,无疑是一个划时代的里程碑。

大模型如何构建开源生态?DeepSeek 会成为 Linux 还是 Android or other?

邓侃:如果让我来选,我认为 DeepSeek 更像 Android,而不是 Linux。

在我看来,Android 真正的成功之处,在于其卓越的架构设计:BP(基础协议)+ AP(应用处理器)的分层架构,让 Android 拥有了强大的跨平台能力和灵活的可扩展性。反观 DeepSeek 的 MoE + MLA 架构,与 Android 的设计理念有着异曲同工之妙:MoE 架构赋予了系统伸缩自如的能力,MLA 机制则大幅提升了效率。我甚至大胆预测,DeepSeek 有潜力成为 AI 时代的“鸿蒙,它完全可以借鉴 Android 的成功经验,构建一个跨设备、跨平台的 AI 开放生态。

李建忠:我忍不住追问一句:DeepSeek 有没有可能更进一步,在算力层也实现反向的“软件定义硬件”,从而一统算力江湖?

邓侃:这个问题很有想象力。DeepSeek 的技术路线,的确有可能倒逼国产 GPU 迎来春天,甚至催生出中国自己的 GPU 标准。DeepSeek 团队对算力效率的极致追求,迫使他们深入 GPU 底层进行优化,这无疑为国产 GPU 提供了绝佳的学习和追赶机会。

如果 DeepSeek 是 Android,谁是中国 iOS?闭源模型是否还有机会?

李建忠:坦白说,我对绝大部分闭源模型的前景并不乐观,但如果一定要说有机会,那也只有极少数与超级应用深度融合的闭源模型了。

在我看来,闭源模型想要突围,必须走“应用 + 模型”的路线,牢牢绑定自身的核心应用场景,打造应用平台的护城河,并借助数据飞轮效应,不断优化用户体验和特定领域的知识积累。放眼中国互联网,字节跳动或许是最有希望成为中国 iOS”的公司,毕竟,超级应用(抖音)和强大的分发能力,是闭源模式得以生存的关键。

邓侃:对于建忠的观点,我持有保留意见。我认为字节跳动如果选择闭源,恐怕不是一个明智之举。在我看来,用户粘性并没有想象中那么可靠,内容平台的用户很容易“用脚投票”,用户粘性并非真正的护城河。一旦竞争对手的内容质量实现反超,用户倒戈只是分分钟的事情。更何况,字节跳动本质上是一家互联网公司,缺乏像 iOS 那样的硬件生态作为支撑。而且,内容质量的提升,并非与封闭性划等号,一个开放、充满活力的生态,往往更能孕育出优质的内容。

大模型到底有没有护城河?如果你是梁文锋,如何建立 DeepSeek 的护城河?

邓侃:要探讨大模型的护城河,我们不妨先回顾一下互联网时代的“护城河三要素”:技术壁垒、用户粘性、内容壁垒。

  • 技术壁垒:DeepSeek 选择了“唯快不破”的策略,通过持续的技术迭代来保持领先,但这本身就存在风险,谁也无法保证永远领先。

  • 用户粘性DeepSeek 需要有意识地培养用户粘性,通过个性化服务和优质体验来增强用户依赖。

  • 内容壁垒DeepSeek 需要不断提升全网数据搜索和优选能力,为用户提供独一无二的优质内容。

综合来看,我认为 DeepSeek 在三个护城河要素中,至少能占据两个半。用户粘性和内容壁垒是 DeepSeek 的优势,技术壁垒虽然有风险,但可以通过持续创新来弥补。

李建忠:对于护城河这个概念,我可能和邓侃的看法不太一样。我认为大模型可能很难建立起像操作系统那样固若金汤的护城河。在我看来,技术壁垒并非真正的护城河:技术迭代太快了,领先优势转瞬即逝。

IT 历史无数次证明,技术领先者最终也可能黯然失色。用户是善变的,忠诚度并没有那么高。再高的初始用户粘性,也抵挡不住颠覆性创新的冲击。DeepSeek 的训练内容本身,可能并不构成独特的竞争优势,其他玩家也能够通过各种途径获取类似的数据。

我更倾向于用美团王兴的“五个 D 理论”(Development, Distribution, Deal, Design, Device)来分析大模型的护城河构建潜力:

  • Development(发平台):DeepSeek 如果能成功打造 Agent 平台,或许能构建起一定的护城河。

  • Distribution(分发渠道):DeepSeek 有机会控制 Agent 的分发,构建类似应用商店的模式。

  • Deal(交易平台):DeepSeek 也有可能涉足 Agent 交易环节,构建支付平台。

  • Design(交互设计):大模型可能很难掌握交互设计的主导权,操作系统在这方面似乎更有优势。

  • Device(设备):大模型不掌控硬件设备,操作系统与硬件深度绑定,控制力更强。

所以我的观点是,大模型在 Development、Distribution、Deal 这三个 D 方面,或许有机会构建一些护城河,但在 Design 和 Device 方面,则可能难以与操作系统级别的护城河相提并论。当然,这只是我目前的思考,也许更重要的是,像梁文峰这样的创新者,他们的目标可能已经超越了传统的护城河思维,他们追求的或许是更广阔的 AI 未来。

DeepSeek 首先会颠覆谁?谁最危险?谁最安全?

邓侃:要回答这个问题,我倾向于从两个维度来分析:一是开源 vs. 闭源,二是产品形态的相似度。在我看来,闭源模型,首当其冲,最为危险。因为开源模型更容易抱团取暖,形成统一战线,共同对抗闭源巨头。而产品形态与大模型核心功能(问答搜索、多模态生成)越接近的行业,也越容易受到冲击。比如,传统的搜索引擎、图像公司、影像识别公司等等,都站在了风口浪尖。

李建忠:我更倾向于构建一个“危险——安全”光谱,来量化不同行业受冲击的程度。在我看来:

  • 最危险的,莫过于信息服务行业(搜索引擎、问答类网站。这些行业的产品形态与大模型的核心功能最为相似,极易被直接替代,可谓“首当其冲”。

  • 其次危险的,是内容行业(内容平台、社交媒体。AI 内容生成将颠覆内容生产模式,创作门槛大幅降低,传统内容平台面临巨大冲击。

  • 再次危险的,是电商行业。Agent 可能绕过传统电商平台,直连商家,重构电商分发体系和流量入口。

  • 相对安全的,是服务行业(O2O 服务,如携程、美团。服务落地需要线下执行,AI 短期内难以完全替代,O2O 平台在整合线下服务资源方面仍有优势。

  • 而最安全的,当属社交行业。社交需求是人类的刚需,情感连接是 AI 难以替代的,腾讯 (微信) 在社交领域的护城河,依然坚不可摧。

AGI 时代,互联网的哪些逻辑会变?哪些逻辑不会变?

在前文关于护城河行业颠覆两大问题的讨论中,已经提前“剧透”了 AGI 时代互联网逻辑的变与不变。

变化的逻辑:

  • 护城河重塑。传统流量、数据、技术壁垒不再是王道,用户交互入口、Agent 生态、场景深度融合,将成为新的护城河。

  • 内容生产颠覆AIGC 将掀起内容创作革命,“人人皆可创作的时代加速到来,内容平台亟需转型。

  • 电商模式重构Agent 可能颠覆传统电商,“去中心化”的 Agent 电商或将兴起,电商平台需积极拥抱 Agent 生态。

  • 交互入口之争人机对话成为新入口,操作系统和超级 App 将上演 “入口争夺战”。

不变的逻辑:

  • 用户需求至上。满足用户需求依然是互联网的铁律,AI 时代亦不例外。

  • 优质内容为王内容为王的本质不会改变,AIGC 时代,优质、独特的内容将更显稀缺和珍贵。

  • 社交刚需永恒。社交是人类的底层需求,情感连接是 AI 无法替代的,社交平台依然拥有不可撼动的地位

DeepSeek 利好哪些职业,哪些职业会更危险?

邓侃:我的观点很直接——任何行业,任何职业,在 AI 时代都既有机遇,也有挑战,关键在于你是否主动拥抱 AI。我的建议是,拥抱 AI 者,乘风破浪;拒绝 AI 者,逆水行舟。

以程序员为例,善用 AI 辅助编程工具,就能效率倍增,将精力投入到更具创造性的工作中。未来,全栈工程师将成为稀缺人才,因为 AI 能够拓展个人能力边界,一人可抵多人。当然,一些重复性、低技能的工作,比如 DBA(数据库管理员),可能会被 AI 自动化工具取代。

李建忠:我认同邓侃的看法,AI 既是挑战,更是机遇。对于程序员而言,与其担心被 AI 取代,不如拥抱 AI,成为 AI 的驾驭者。

我认为,程序员不会大规模失业,但职业发展路径会发生转变。就像汽车出现后,马车夫消失了,但司机却成为了更庞大的职业群体。AI 时代,程序员将从单纯的“代码工人”,进化为“软件构建师”,他们将更多地利用 AI 工具来提升效率,专注于更高级的架构设计、业务理解和创新应用。未来,“人人都是开发者”或许不再是梦想,掌握 AI 工具,人人都有机会参与软件创造。

推理计算范式下,代码能力越来越强,程序员是否会大规模失业?

这个问题与第九问异曲同工,两位嘉宾的观点也高度一致:AI 代码能力的突飞猛进,不会导致程序员大规模失业。

AI 辅助编程工具,能够极大地提升程序员的生产力,让程序员有更多精力专注于高阶任务。未来程序员的核心竞争力,将不再是单纯的“手撸代码”,而是对业务的理解、对架构的设计、以及对 AI 工具的驾驭能力。

总结与展望

本期对话,李建忠与邓侃两位专家,以其前瞻性的视野和犀利的观点,为我们奉上了一场精彩绝伦的 AI 思想盛宴。他们深入探讨了 DeepSeek 现象背后的技术逻辑和产业影响,更对 AGI 时代 AI 的未来发展趋势,进行了大胆而富有洞见的预测。

「DeepSeek 暨 AI 进化论十日谈」系列直播,将继续秉持开放、思辨、前沿的理念,邀请更多 AI 领域专家,带来更多深度、尖锐、前瞻的思想碰撞,敬请期待后续更精彩的直播!

目前,系列直播已经连载至第六讲:

十日谈第 1 讲(2 月 6 日) |  综述开场:DeepSeek 技术创新及对 AI 生态的影响

  • 李建忠  CSDN 高级副总裁

十日谈第 2 (2 月 7 日) |  强化学习是否会带来大模型的范式转换?

  • 李建忠  CSDN 高级副总裁

  • 张奇  复旦大学教授、MOSS 大模型核心人员

  • 刘勇  中国人民大学高瓴人工智能学院副教授、博士生导师

十日谈第 3 (2 月 8 日) |  直击 Deepseek 技术真相,对我们究竟意味着什么?

  • 唐小引  CSDN&《新程序员》执行总编、《万有引力》栏目主持人

  • 吴双  硅谷资深 AI 技术专家

  • 刘伟  北京邮电大学人机交互与认知工程实验室主任

  • 王文广  《知识增强大模型》作者、前达观数据副总裁

十日谈第 4 (2 月 8 日) |  DeepSeek 十问(就是你现在看的这篇文章!)

  • 李建忠  CSDN 高级副总裁

  • 邓侃  大数医达创始人兼 CEO

十日谈第 5 讲(2 月 9 日) |  聊聊关于 DeepSeek 的十大错误认识

  • 李建忠  CSDN 高级副总裁

十日谈第 6 (2 月 10 日) |  DeepSeek 及大模型创业十问

  • 李建忠  CSDN 高级副总裁

  • 陶闯  微软地图之父、维智科技集团创始人兼董事长

十日谈第 7 (2 月 11 日) |  DeepSeek 与软件开发智能化

  • 李建忠  CSDN 高级副总裁

十日谈第 8 (2 月 12 日) |  DeepSeek 对 AI 技术及开发者的刷新十问

  • 唐小引  CSDN&《新程序员》执行总编、《万有引力》栏目主持人

  • 崔淦渠  上海人工智能实验室青年科学家

  • 李佳芮  句子互动创始人、CEO

  • 吕仲琪  中国石油大学(北京)副教授,人工智能学院计算机系系主任

十日谈第 9 (2 月 13 日) |  DeepSeek 有意识吗?

  • 蒋涛  CSDN 创始人&董事长

  • 李剑锋  复旦大学教授、高分子科学智能研究中心副主任

  • 白丁  科幻作家、《云球》作者

十日谈第 10 (2 月 14 日) |  DeepSeek 情人节特辑

  • 李建忠  CSDN 高级副总裁

「DeepSeek 暨 AI 进化论十日谈」系列直播栏目,还将继续为您奉上更多精彩内容,第七讲直播再次由建忠老师“Solo”,深入探讨 DeepSeek 如何推动软件开发的智能化转型,分析其在提升开发效率、优化流程及增强协作方面的创新应用。建忠老师将分享前沿见解,揭示 AI 如何重塑软件开发的未来。欢迎预约今晚直播

(文:AI科技大本营)

欢迎分享

发表评论