对话陈帜：从6个月到1小时，看AI for Science如何设计"火箭心脏"

作者｜Yoky
邮箱｜yokyliu@pingwest.com

2023年7月12日清晨，酒泉卫星发射中心的戈壁滩上，朱雀二号运载火箭如银色巨龙般腾空而起，尾焰在晨光中划出淡蓝轨迹。这枚全球首款成功入轨的液氧甲烷火箭，箭体高49.5米，白色箭身缀以红色朱雀图腾，携带着219吨的起飞重量和268吨推力，将卫星精准送入轨道。

然而，在发射成功的欢呼背后，摆着更加现实的问题，朱雀二号虽然成功发射，但在承接商业订单时面临着运力成本过高的挑战。2023年之后，蓝箭航天开始着手对朱雀二号进行改型，尽管遥二、遥三、改型遥一任务进展顺利，但运力成本仍然较高，影响了商业航天运输实际效益，这是需要解决的关键问题。

在这样的情况下，蓝箭航天与北京科学智能研究院（以下简称研究院）开始共同探索如何用AI for Science技术，来系统性的降低成本。

“我们与蓝箭的合作目标并非直接降低运力成本，而是通过优化天鹊发动机性能间接实现成本下降。采用更保守的估计，合作目标将传统5年的改型周期缩短至2年，或将2年的周期缩短至1年。”北京大学工学院特聘研究员、北京科学智能研究院研究员陈帜教授告诉我们。

基于与蓝箭航天的合作，以及DeepFlame燃烧流体计算开源平台，在刚刚过去的2025中关村论坛-AI for Science青年论坛中，发布了DeepFlame Rocket APP（中文名：临界炽核），其移动端同期上线。

如今，AI不仅助力朱雀二号的改型，更深度参与了朱雀三号的研发，涵盖燃料研发等关键环节。这场航天与AI的深度融合，正引领着商业航天迈向新的征程。

本期硅星人对话，我们有幸邀请到陈帜——北京大学工学院特聘研究员、北京科学智能研究院研究员，共同探讨如何用AI助力设计制造火箭发动机，造星际旅行中的一张平民船票。

以下是对话实录：

用AI设计“火箭心脏”，从5000小时到5000秒

硅星人：蓝箭航天、研究院、鲲鹏三方在合作中各自承担哪些角色？例如，蓝箭航天提供哪些数据或场景，鲲鹏提供什么？DeepFlame团队如何整合技术与需求？

陈帜：整个流程是这样：蓝箭作为应用端企业，为我们提供真实的工程数据和场景，我们通过算法满足这些需求；我们再将算力需求提交给鲲鹏，鲲鹏通过硬件的改造来满足和实现更好的性能。

我们和蓝箭最早从2021年开始接触，直到2023年底至2024年初，我们才获得他们的真实需求、实际构型和测试参数。与我们之前的理论预期相比，实际情况有很大不同。

对于研究院来说，此前我们只能从国外发表的学术论文中获取信息，而这些资料通常隐藏了关键参数，我们只能猜测，结果自然有偏差，有些论文中还会采用一些“小技巧”有意隐藏，这使得我们的计算结果参考价值有限。学术论文通常不会将工况参数设置到100%，通常只测试到60-70%的状态，这与实际工程需求有很大差距。和蓝箭合作以后，我们获得真实需求和数据之后，做出了相应调整。

研究院的角色更多其实是作为闭环生态的发起方和关键链接者，主导着将产业链各方连接起来的工作。如果没有研究院来发起，这个生态系统可能无法被串联起来。研究院提供“玻尔科研空间站”平台进行云资源调度，将各种方程求解器整合到平台上。我们DeepFlame团队在研究院框架下，负责开发面向火箭发动机模拟的应用程序，将物理仿真、AI和HPC深度耦合到一个计算平台中。

硅星人：目前双方合作有哪些具体的案例么？我们与蓝箭做了哪些项目上的合作？

陈帜：我举几个例子，比如说朱雀2号虽然已经发射成功，但他整个的运力成本（单位千克载有效载和入轨所需要花费的成本）还是比较高，但是对于商业航天公司来说要接商业订单，相比于国际先进水平，还有些差距。对于朱雀2号的改型、朱雀3号可回收技术的研发就是要把这个价格降下来。

传统的改型其实是依赖于试验。即阶段性改型之后进行试车或飞行试验，再优化迭代。通过AI进行虚拟试验，一是加速了改型的时间，比如天鹊发动机型号的改型从原来的5年变成两年甚至更短1/4；二是以虚拟试验来辅助试车，来节省发射成本。

硅星人：我们会在燃料创新上有合作么？比如合成代替液氧甲烷的新的又轻又高效率的燃料？

陈帜：目前没有，这块还是有点难。将来会探索一些合成燃料，因为甲烷毕竟还是便宜，合成材料肯定不比甲烷便宜。当然关于朱雀3号的研发我们也在合作进行中，目前是这两个比较大的合作项目。

硅星人：目前合作已落地的标志性成果是什么？有哪些显著提升的数据么？

陈帜：最具代表性的里程碑是我们实现了对蓝箭火箭发动机单步模拟的计算效率革命性提升。

用一个具体数据来说明：传统方法需要使用2000个英特尔CPU，采用常规数值模拟方法计算蓝箭火箭发动机的单步模拟需要1小时。而使用我们的DeepFlame Rocket方案，采用双神经网络架构，仅需4张GPU，同样的计算只需1秒钟完成。这相当于从1小时缩短到1秒，效率提升了3600倍。

在实际工程应用中，蓝箭的一次完整计算通常需要5000个迭代步，这意味着传统方法需要5000小时，约6个月的时间，而DeepFlame方法只需5000秒，约1.4小时就能完成。这一突破性进展使得蓝箭能够在朱雀2号的基础上更快地迭代优化设计，为朱雀3号的研发奠定了基础。

有一点值得注意的是，用传统方法计算一次的时间和成本甚至超过了直接进行一次实物试验的时间和成本，这也解释了为什么在朱雀二号研发过程中，他们主要依赖实验而非模拟。而现在，使用我们的解决方案，只需一台配备4个GPU的机器，仅需1小时左右就能得到参考结果。

目前我们的模拟与实际结果的偏差控制在15%以内，这在航天工业中是可接受的精度。我们主要关注的是燃烧效率这类宏观指标，即喷入的燃料有多少真正转化为能量，这直接影响最终的运力成本。

硅星人：合作遇到的最大技术或协调难题是什么？如何解决的？

陈帜：在这个跨领域合作中，我们确实遇到了一些重大挑战。最大的技术难题是如何将传统算法和AI方法有机结合，并与计算硬件形成良好的协同。

传统的火箭发动机燃烧模拟涉及复杂的物理和化学过程。即使看似简单的甲烷燃烧也涉及几十种物质和几百个反应链路，导致维数爆炸，传统计算方法难以应对。我们需要在保证物理守恒定律和化学反应准确性的前提下，引入AI方法来加速计算。

特别棘手的挑战是在物理约束和数据驱动之间找到平衡。严格保证物理约束的模型参数规模往往难以扩大，通用表达能力相对较弱，但在特定任务中精度更高。而偏向数据驱动的模型可以做得更大，训练也相对容易，但缺乏物理保证。在火箭发动机这样的高风险领域，物理约束是必不可少的，否则会导致严重的’幻觉’问题和安全隐患。

我们的解决方案是采用混合方法——将AI主要用于替代复杂化学反应过程的计算（这部分最耗时且难以高效并行化），而对于湍流模型和流体计算这些相对成熟的领域，仍然依赖传统计算方法。这种智能组合充分利用了AI在处理高维度、非线性问题上的优势，同时保留了传统方法在成熟领域的可靠性。

硅星人：除了技术方面的问题，在协作中有哪些难题么？

陈帜：还有一个重要挑战是数据标准化问题。在AI for Science领域，数据普遍分散，且每个小领域都有自己的数据标准。我们需要进行抽象处理——从实际数据中找出规律，然后生成合成数据。这样既不侵犯数据隐私，又能保证我们训练出的模型和评测结果具有实际参考价值。

解决这些挑战的关键在于：技术上采取混合方法结合传统计算和AI优势，硬件上利用新型一体化架构避免异构计算瓶颈，协调上则通过展示技术价值建立信任和数据共享机制。

AI三要素，关关都需攻克

硅星人：您刚提到了数据分散的问题，这是AI for Science落地应用中的一个难关么？从AI三要素（数据、算法、算力）的视角出发，哪个环节是最困难的？

陈帜：在AI for Science领域，这三方面都处于非常基础的阶段。不像通用AI领域已经有了完整的基础设施可以直接调用，我们几乎要从头开始构建整个生态系统。

数据方面，正如我前面所述，科学计算领域的数据普遍分散且不统一，首先获取这些数据都是非常困难的，高校研究人员在进行实验、计算和论文研究过程中积累了大量数据，企业拥有实际应用场景的数据，产业链各环节也有各自的数据。

当然数据的问题不仅仅是数据收集和标准化，还在于多尺度多物理耦合的数据问题。科学现象往往跨越多个时间和空间尺度，如从原子级反应到宏观流体动力学。不同尺度的物理过程相互耦合，难以用单一模型描述。每个尺度都需要特定类型的数据，而这些数据之间的关联性也需要建模。例如，在燃烧模拟中，我们需要同时考虑分子层面的化学反应和宏观层面的湍流混合，如何获取和整合这些跨尺度的数据是一个巨大挑战。

第三是先验知识与数据融合的问题。科学领域已经积累了丰富的理论知识和经验规律，如何将这些先验知识有效地融入到基于数据的AI模型中是一个开放性问题。纯粹依靠数据的模型可能会忽视重要的物理规律，而过度依赖理论又会限制模型的表达能力。找到两者之间的平衡点需要大量的探索。

第四是数据不确定性与噪声处理。科学实验数据往往伴随着测量误差和系统噪声，而数值模拟数据也可能包含截断误差和舍入误差。这些不确定性如何量化并传播到模型预测中，是确保模型可靠性的关键。在神经网络训练中，过拟合噪声可能导致模型完全偏离物理规律，这在科学应用中是不可接受的。

硅星人：那关于数据分散、不统一的各种问题，应该怎样解决？

陈帜：我们的方法是将基准构建作为一个开放性倡议，做好接口和贡献准则，鼓励各方将关心的场景和已有数据放进来，然后由我们进行集成，这类工作看似很简单在前期常被低估，但它需要深厚的领域知识来确保数据的物理一致性和科学准确性。对于燃烧模拟这样的领域，数据集需要涵盖从低负荷到极端工况的全部运行状态，同时考虑不同的燃料组合、压力条件和温度范围等多种因素。

我们的目标是构建一个类似于科学领域的“ImageNet”，它不仅包含大量高质量数据，还定义了评估标准和基准测试方法，然后对外开源，最终推动算法的改革。

AI应用在整个燃烧反应计算的哪一个环节？对于算法的高要求和复杂性体现在哪？

陈帜：我来给大家解释一下为什么燃烧反应如此复杂，以及我们是如何用算法来处理这种复杂性的。

看似简单的氢氧反应，实际上是一个多尺度、多物理场耦合的复杂过程。大家可能觉得氢气和氧气反应就是2H₂ + O₂ → 2H₂O，看起来非常简单，但实际情况远非如此。

让我们深入微观尺度看看。这个反应实际上包含了数十个基元反应步骤，涉及H、O、OH、HO₂等多种活性自由基。比如，氢分子首先需要分解为氢原子：H₂ → H + H，然后氢原子与氧分子反应：H + O₂ → OH + O，接着OH又会与氢分子反应：OH + H₂ → H₂O + H…如此循环往复，形成一个复杂的反应网络。

更复杂的是，每个基元反应的速率都取决于温度、压力和浓度，这些参数又受到流体流动和热传递的影响。在湍流条件下，情况变得更加复杂，因为湍流涡旋会导致局部温度和浓度的剧烈波动。

传统CFD方法面临一个两难困境：要么使用详细化学机理以获得高精度，但计算成本高得难以接受；要么使用简化机理以提高计算效率，但会牺牲精度。在航空发动机或火箭发动机这样的复杂系统中，完整模拟可能需要几周甚至几个月的超算时间。

我们的创新在于开发了一种物理信息神经网络算法。以氢氧反应为例，我们首先用量子化学计算和详细反应动力学生成高精度数据，然后训练神经网络来表示这种复杂的非线性关系。但我们不是简单地拟合数据，而是在网络中嵌入关键的物理守恒定律和热力学约束。

具体来说，我们的神经网络不仅要最小化预测误差，还要满足质量守恒、能量守恒等物理定律。例如，网络必须保证H原子在反应前后的总数不变，这一点通过我们设计的特殊损失函数来保证。

在实际应用中，这种算法能将氢氧反应的模拟速度提高约100倍，误差控制在5%以内。对于更复杂的碳氢化合物燃烧，加速比甚至可达1000倍以上。

更重要的是，我们的算法具有很强的可迁移性。在火箭发动机燃烧模拟中训练的模型，经过适当调整后可以应用于电池热失控、建筑火灾等场景。这正是我们技术的核心优势——将物理学的普适性与AI的学习能力相结合，创造出既符合物理规律又高效准确的新一代计算方法。

我们不是用AI替代物理模型，而是用AI增强物理模型，让复杂的科学计算变得更加高效和易于应用。这也正是AI for Science的精髓所在。

硅星人：如果AI模型在氢-氨燃料场景中表现优异，如何确保其在甲烷-液氧等新燃料中的泛化性？是否会出现一个通用的模型，还是每一个细分场景都需要一个单独的求解器，嵌在DeepFlame的框架里？

陈帜：目前的情况是，完全通用的单一模型仍难以实现，但我们正在向这个方向努力，并取得了一些突破性进展。

燃烧过程的物理本质是相似的——都遵循相同的基本物理定律，如能量守恒、质量守恒等。这种普适性为我们构建通用模型提供了理论基础。但不同燃料体系的具体反应机理、中间产物和反应路径有显著差异。例如，氢燃烧相对简单，涉及的化学种类和反应步骤较少；甲烷燃烧则涉及几十种物质和几百个反应链路；而更复杂的燃料如煤油可能涉及上千种化学物质和上万个反应路径。

我们目前采取的是“通用框架+特定参数”的混合方法。具体来说：

对于物理核心部分，如流体动力学、传热传质等基础物理过程，我们构建了通用的物理信息神经网络框架，这些网络嵌入了物理守恒定律，能够在不同燃料体系间迁移。

对于化学反应部分，我们采用了一种模块化设计，将不同燃料的反应机理封装为可替换的模块。这些模块可以基于特定燃料的数据单独训练，然后插入到整体模型中。

我们还开发了“小样本学习”和“参数迁移”技术，使得已训练的模型能够通过少量新燃料的数据快速适应新场景。这类似于人类专家如何将一种燃料的经验迁移到新燃料上，只需要少量调整就能适应。

例如，我们在氢-氨体系中训练的模型，通过提取反应的公共特征和模式，再加上少量甲烷-液氧数据进行微调，就能在新燃料体系中取得不错的性能。这比从零开始训练一个全新模型效率高得多。

硅星人：这在理论上似乎可行，但在实际应用中不会因为现实的情况不同而导致偏差么？

陈帜：在实际应用中，我们确实发现不同复杂度的燃料体系需要不同程度的模型定制。对于相对简单的燃料，如氢燃烧，模型的通用性较好；而对于复杂燃料，如煤油，可能需要更多的特定训练数据和模型调整。

因此，从长远来看，我们认为DeepFlame框架将会形成一个“模型谱系”，而非单一通用模型。这个谱系包括：

基础通用模型：捕捉所有燃烧过程共有的物理特性
燃料类别特定模型：针对气体燃料、液体燃料等大类进行特化
具体燃料专用模型：为特定燃料组合(如甲烷-液氧)优化

这种分层设计使我们能够在通用性和专用性之间取得平衡。用户可以根据自己的需求，从模型库中选择合适的预训练模型，然后根据自己的数据进行微调。

这种模块化、可迁移的设计与DeepFlame的整体框架理念高度一致。DeepFlame作为一个面向科学计算的开源框架，其核心价值在于提供统一的接口和底层抽象，支持不同求解器的灵活集成。无论是传统基于方程的求解器，还是基于AI的求解器，都可以嵌入到这个框架中，形成一个生态系统。

目前，我们已经在DeepFlame框架内实现了多个专用求解器，包括针对氢燃料、甲烷燃料和液氧燃料的特定模型。这些模型共享相同的数据处理接口和评估标准，方便用户根据具体应用场景选择合适的求解器。

当这一流程打通后，下一个挑战是效率问题：用户不希望等待三天才能得到结果。这时算力就变得至关重要。值得一提的是，AI for Science(科学智能)与通用AI训练和推理有显著不同，可能需要新型算力架构，能够很好地兼容传统算法并无缝融入AI组件。

从理论到产业落地

在2025中关村论坛年会中，DeepFlame发布了DeepFlame Rocket ，为什么要同时发布一个移动端的产品？它的主要用户是谁？这是产业落地的重要一步么？未来，造火箭的技术能力还将衍生到哪些领域？产生什么样新的价值？

陈帜：首先DeepFlame Rocket APP是我们AI技术能力的最佳展示窗口。将复杂的科学计算压缩到移动设备上运行，本身就是对我们技术极致优化能力的证明。我们通过玻尔空间站构建了一个能力框架和开放的API接口，这个APP证明了我们可以通过玻尔来打造一个移动端的APP深入到产业使用，不仅准确，而且足够轻量化，能够在资源受限的环境中高效运行。

它的用户其实包括了火箭设计师、工程师等专业人士。他们可以将APP作为随身携带的快速参考工具，用于初步验证想法或进行快速估算，然后再回到专业工作站进行精确计算。

当然这只是一个场景的APP，我们希望提供像安卓一样的开放平台，让拥有技术能力的企业自己构建移动端的工具，来端到端的解决实际的问题。

DeepFlame不仅面向商业航天，还适用于火灾预防、燃气轮机、汽车氢燃料/甲醇应用等多个领域。实际上，它甚至不局限于燃烧相关场景，只要涉及化工流体和反应，如反应器内的流动，都可以应用这一技术。

比如预测电池在极端条件下的热失控行为、火焰蔓延路径和有害气体释放情况。这些模拟可以帮助电池制造商优化电池设计和热管理系统，提高安全性；也可以帮助车企和储能系统开发商制定更有效的消防策略和安全防护措施。

再比如我们有一个合作方是一家国外的工业保险公司，他们需要预测工厂发生火灾的概率，火灾传播模拟与火箭发动机中的燃烧过程有许多相似之处，都涉及复杂的化学反应、多相流动和热传递过程。

未来这种抽象出来的框架能力，才是AI for Science服务产业的关键问题。

点个“爱心”，再走吧

（文：硅星人Pro）

对话陈帜：从6个月到1小时，看AI for Science如何设计”火箭心脏”

发表评论取消回复

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复