AI编程赛道火热，为什么国资选中北大aiXcoder？｜

把aiXcoder等同于一个模型是最大的误解。

作者｜苏霍伊

编辑｜王博

国资进入AI编程赛道了。

「甲子光年」独家获悉，硅心科技（aiXcoder）前不久完成了A++轮融资，投资方为中关村发展集团旗下中关村资本，硅心科技成为了国内首家国资投资的专注AI+软件工程的企业。据公开资料显示，aiXcoder目前共获得4轮融资，吸引了伽利略资本、高瓴创投、彬复资本、清流资本、三七互娱等多家顶级风险投资机构的持续注资。

尽管AI编程赛道火热，但国资的进入往往有着更深层次的技术自主性、产业生态构建的意义。

「甲子光年」观察到，当前的AI编程市场需求已经从“能写代码”向“能交付特定任务”转变。

通用大模型如GPT、Claude、Llama等，能够根据自然语言描述生成代码。但是通用大模型主要利用互联网上的公有数据进行训练，无法覆盖私域数据，通常仅能支持通用领域的软件开发。然而，更多的软件开发需求来源于特定行业，通用大模型在面对特定业务场景和需求时，其孤立性和对业务逻辑的理解不足，导致了其对复杂需求的处理虽表面上可行，实际上却缺乏可信度，无法提供充分的支持。

这是AI难以实现企业特定领域化应用的的痛点，同时也是aiXcoder团队的着力点。

aiXcoder团队由北京大学软件工程研究所孵化，是国际上“基于深度学习的程序理解与生成”的先驱性研究者。团队自2013年起就开始探索深度学习技术在代码生成和代码理解方面的应用，累计在国内外顶级学术期刊/专业期刊发表论文100多篇，其中多篇是智能化软件工程领域的首篇和引用率最高的论文。2021年12月发布全球首个超过十亿参数量的aiXcoder 1.3B代码大模型；2022年6月发布国内首款13B代码大模型。自主研发的“aiXcoder代码大模型”是业内首批完成国家备案的代码大模型企业。核心产品智能化软件开发系统一直在向B端企业客户和C端开发者提供实时智能开发辅助，并持续通过深度定制方案解决大模型与领域知识融合的难题，帮助企业提升软件开发效率和研发效能。

近期，aiXcoder产品升级，最新推出Agent（智能体）模式，并内置MCP（大模型上下文协议）功能，创新为软件开发行业带来全流程自动化解决方案。该技术通过模拟人类开发者的任务规划、工具调用、自主反思、逻辑推理等能力，可智能完成项目级代码生成、修改、调试、重构等复杂软件开发任务，显著提高企业研发效率，大幅缩短研发周期，助力企业数字化转型。

总的来说，aiXcoder通过独特的深度定制解决方案，专业代码大模型的个性化训练，结合Agent协同能力和Prompt工程化，并融合业界成熟的工具链和工程实践，实现软件开发效率与质量的全面提升，让模型输出更贴合企业和用户的实际需求。

目前aiXcoder已在金融、军工、航天、IT等领域落地，服务众多行业头部客户，打造多元场景标杆案例。

无论是从科研成果转化角度，还是专业领域模型与通用大模型的竞争角度，亦或是AI模型应用落地角度来看，aiXcoder都走出了一条新的路径，而国资的注入就是对这条新路径的认可。

1. 最新推出内置MCP功能的软件开发领域Agent产品

从“高级代码生成与补全工具”进化为真正的“AI软件工程师”，除了需要“脑子”——大模型之外，还需要“手”——自主调用工具的能力。

近期，aiXcoder产品升级，创新推出Agent模式，并内置MCP功能，助力企业实现复杂软件开发任务的自动化处理，可以针对性适配企业已有的开源大模型。相比Cursor每月20-40美元费用，aiXcoder Agent功能计划在插件端免费开放，使用Agent无门槛，推动AI Coding行业发展。

aiXcoder Agent实现原理

开发者可通过aiXcoder Agent快速配置安装MCP Servers，将常用软件开发工具和企业专属工具无缝集成至平台。当大模型处理需求时，aiXcoder Agent智能中枢会通过MCP协议栈实时分析任务上下文，自主选择最优工具进行调用，进而完成多类型任务。

在Agent模式下，AI相对于开发者来说，更像一个Partner，双方通过自然语言交互，即可完成端到端的软件开发任务。开发者不再需要逐行编写大量的代码或反复操作多个文件，只需要在关键节点，点击接受或者拒绝，显著提高工作效率的同时，可以将更多精力集中在核心业务逻辑的设计和架构优化上。

“Agent是一个具备完整执行链条和工具能力的系统，它不是聊天式的，不是纯推荐代码的，它是工程意义上的、可以执行任务的系统。”aiXcoder联合创始人刘洋告诉「甲子光年」，“它能把一个复杂问题拆解成多个分支任务，在执行中与人不断交互确认，最终生成贴合真实业务需求的结果。”

以开发金融业务系统的后台管理页面为例。传统的做法可能是需要手动分析需求、设计架构、编写代码、调试测试并逐步迭代优化，这通常是一个耗时且复杂的过程。

但是在aiXcoder Agent模式下，开发者只需输入指令：“根据提供的API，制作一个交互友好的后台管理页面。”Agent就会立即结合总体目标拆分任务，实现需求解析、多文件编辑、逻辑设计、各功能模块构建等全流程自动化，期间还会自动执行终端指令与调用浏览器启动服务和进行效果验证，不到30分钟就可以自主完成金融系统的后台管理页面开发上线。

在上线了Agent功能后，aiXcoder为智能化软件开发赋予了更多的主动性。总体而言分为三类：

复杂任务规划能力：能够将复杂任务分解为多个合适的、可执行、可验证的步骤，并自主规划执行；
自主学习与优化能力：根据用户反馈和任务结果不断学习或调整计划，比如生成的代码有编译错误时Agent会自动解决；
实时交互与协作能力：用户能随时介入任务执行过程，调整需求或方向。

“我们希望aiXcoder Agent能够像一位经验丰富的高级开发者一样工作，不仅能够理解需求，还能够主动提供解决方案，甚至在复杂任务中分解问题并逐步解决。”刘洋介绍。

2.一个专业代码大模型的自我修炼

智能化软件开发离不开一个专业的代码大模型。

aiXcoder 7B就是aiXcoder团队在2024年4月正式推出并开源的全自研代码大模型，基于1.2T高质量代码数据集、专门结合代码特性、针对代码相关任务进行了预训练，具有易部署、易定制、易组合等特性。

在多个主流测评集上，aiXcoder 7B代码生成与补全能力超越同级别及更高参数规模的开源模型。

aiXcoder 7B与同级别模型对比

aiXcoder 7B在企业真实开发场景下的代码处理能力如何呢？aiXcoder基于16000多条来自真实开发场景的数据，构建了一个大规模测评代码生成补全数据集，并对多个大模型进行测评。结果显示，aiXcoder 7B不仅在代码生成与补全方面效果最好，且生成的代码更加简洁，更接近人类编码风格。

现有通用大模型在实际软件开发中表现受限的核心原因，在于其将代码简单等同于自然语言文本的处理方式，忽视了代码作为结构化逻辑实体的本质特性。真正的软件开发，需要AI不仅能“背代码”，还要理解代码背后的“语法规则”和“工程逻辑”。

在AI编程领域，aiXcoder 7B提出的“将代码特性引入大模型训练”是一个突破性创新，其核心在于通过代码的结构化特征重构训练范式。aiXcoder 7B针对代码特性所采取的创新训练方法有：高质量训练数据构建、基于代码结构的模型训练、项目级多代码文件排序。其创新之处远非简单使用代码数据训练模型，而是系统性地将代码的本质特性转化为模型学习目标。

这种转变也让代码大模型从“高级代码生成与补全工具”进化为真正的“AI软件工程师”，核心能力边界从字符序列扩展到完整的软件工程语义空间。

aiXcoder 7B相关论文被软件工程领域国际顶级会议 ICSE 2025收录，以严格著称的ICSE审稿人如此评价aiXcoder 7B的相关论文：“这篇论文涉及了一个阻碍大模型进行代码应用部署的关键问题，即最先进的LLM模型体积庞大，且为提升性能而倾向于增大模型规模。它让代码补全时间过长，进而影响用户体验。本文通过提出一种改进的代码补全模型训练方法来解决这一问题。”“本文推导了一个新的代码补全基准，这对希望评估LLM在代码补全方面表现的研究人员和从业者来说，具有重大贡献。”

审稿人提到的关键问题就是aiXcoder团队从用户体验角度出发去解决的，他们没有盲目追求参数规模，而是在训练初期就聚焦实际应用场景。

刘洋告诉「甲子光年」：“我们选7B模型，是对模型速度和能力的权衡。越大的模型生成越慢，而开发者更希望‘毫秒级’响应，不打断工作思路。”

这一年，aiXcoder 7B为企业实现大模型的低成本部署和领域化应用提供了全新解决方案。而通过企业领域代码个性化训练，aiXcoder团队还可以根据企业需求训练企业专属代码大模型。

企业领域代码个性化训练

在真实软件开发场景中，代码大模型往往需要处理不同类型的上下文，比如当前文件的上文、跨文件上下文、相关代码段等，以实现高精度代码补全。这种复杂的上下文形式与通常的模型预训练时的上下文形式不一致，所以限制了模型在实际应用中的代码补全准确率。

「甲子光年」了解到，为解决这个问题，aiXcoder团队计划在今年上半年推出aiXcoder 7B 2.0，在多种主流编程语言及框架下的多行补全上，相较于去年4月发布aiXcoder 7B 1.0，经过优化的新模型在Exact Match（完全匹配）指标上效果提升13%。

3.把aiXcoder等同于一个模型是最大的误解

由于aiXcoder 7B的知名度，不少人会把aiXcoder简单理解一个专业代码大模型开发团队，但这是对aiXcoder最大的误解。

“我们相信，软件交付的其实是业务价值。”aiXcoder商业合伙人兼总裁刘德欣告诉「甲子光年」。

aiXcoder团队所做的事情是：通过专业代码大模型的个性化训练，结合多个Agent协同和Prompt工程化，并融合业界成熟的工具链和工程实践，实现软件开发效率与质量的全面提升，让模型输出更贴合企业和用户的实际需求。

与AI编程赛道的其他产品，如GitHub Copilot、Cursor、Codeium及国内的AI+代码产品相比，aiXcoder有着独特性的差异。

以GitHub Copilot为代表的产品，其在IDE（集成开发环境）中以插件形式集成，在用户输入时提供灰色候选建议。Copilot在全球使用者众多，但本质上依然是“被动式”的：仅在用户输入后进行响应，不会主动任务规划与执行。此外由于其采用云端推理，也让企业用户在处理敏感代码时充满隐私和数据安全顾虑。

而被称为“聊天式编程”的Cursor则从交互层面做出了更为激进的创新。它类似VSCode的编辑器，集成了GPT-4、Claude 3.5等LLM模型，支持对话驱动的代码理解、定位与修改，适合处理上下文超长的个人项目。但目前来看，Cursor的部署方式更契合个人开发或初创团队的需求，在企业级定制化能力和权限管理支持方面仍相对有限。

另外，我们也发现这些针对于C端提供的编程助手，在引入Agent以后，对整体的项目改动是没有严格边界的，有的时候会改动程序员不希望修改的很多文件，导致程序员并不知道自己的哪些项目被修改过。从程序员角度出发，构建企业级产品，我们首先要做到给程序员以安全感，大模型以Agentic方式做自动化生成没问题，但我们需要确保全程可控，程序员始终知道大模型是在按照他的意图完成工作，而不是替他做主完成工作。

aiXcoder走出了一条新的路径：不是做一个“写得更快的IDE插件”，而是构建一个可以规划任务、调动工具、生成代码并负责结果的“AI软件工程师”。

aiXcoder把智能化软件开发分成了两个阶段：第一阶段通过引入大模型技术，集中实现一些初级的自动化场景，但在关键的业务应用中，模型输出的准确性和实用性受到质疑，限制了相关产品在实际企业环境中的应用效果和用户的信任度，目前超过90%的企业落地大模型还处于该阶段；第二阶段面向企业领域知识做有效个性化训练，聚焦打造企业领域化解决方案，同时需要紧贴着企业的软件开发框架，将企业内部那些稳定的、大量的业务逻辑和高频代码场景，利用AI的方式找出来并提取为Prompt体系，然后在用户输入的应用节点，以背景信息的形式、灵活的以智能化的方式提供给大模型，从而显著提升模型的业务理解力和输出准确率，这种方式确保了模型输出更贴合企业和用户实际需求。

如果说Copilot是“AI代码补全工具”，Cursor是“对话式集成开发环境”，那么aiXcoder就是一个与实际场景深度融合的智能化软件开发平台。aiXcoder的思路更“聚焦”也更“深入”，刘洋坦言：“我们要做的，就是把大厂做不动的麻烦事给做透。”

因此他们选择了一条B端+C端的“双轮驱动”路径。

在B端，aiXcoder针对企业客户提供私有化部署的AI编程助手和配套的专业服务，包括大模型的训练微调、咨询及软件开发流程优化等。

“我们现在大部分客户来自于B端，主要是集中在企业的私有化部署、模型的领域化训练和软件开发流程的优化等方面。通过软件订阅加专业服务的方式收费，客单价比较高，粘性也比较大。”刘德欣说。

「甲子光年」发现，aiXcoder的客户集中在金融、军工、航空航天、能源、交通等行业，这些行业对代码生成的精度、安全和合规有着近乎苛刻的要求。以银行业务为例，代码中不仅充满大量金融术语，而且需严格遵循监管与审计规范。

“银行的客户更关注它的合规。我们通过私有化部署帮他们训练之后，整个代码的合规性整体提升了50%，研发成本也下降了约20%。”刘德欣介绍，“此外我们曾为某头部证券公司进行了两轮个性化训练，将模型的准确率从约10%提升至35%。他们也曾尝试通过LoRA 等微调方式自主优化，升幅仅为3%到4%。”

而在与航天502所的合作中，双方联合推出首个先进人工智能技术与软件工程相结合、自动将控制算法生成程序代码的软件开发产品，极大提高航天软件开发效率和质量，引领航天软件智能化开发新模式。该项目也因此入选AIIA（中国人工智能产业发展联盟）发布的先锋案例。

这些高壁垒场景要求模型不仅懂编程语言，更要理解行业术语、代码规范和系统架构。在传统开源大模型层面，这些能力往往缺失，无法满足企业的工程化需求。

为了满足这些行业的高要求，aiXcoder提出了一种可标准化交付的“深度定制化”路线，核心思路是将大模型“驯化”为熟悉客户业务的专用助手。

但这是否意味着aiXcoder走上了传统To B行业的“费时费力做定制化服务”的老路呢？

对此，刘德欣回应：“我们不做那种人力密集的定制化‘二开’，而是利用我们多年沉淀的工具和流程，去赋能客户和伙伴可复制、规模化的模型调优能力。”

在aiXcoder的解决方案中，有一个非常关键的环节——深度定制，可以有效解决大模型与企业领域化融合难题。不同于市场上普遍存在的弱定制方案——使用PEFT（高效参数微调）、SFT等常规微调方式和RAG的方式，aiXcoder深度定制方案层层递进且又相互独立，企业可结合自身情况和需求对号入座，获得量身定制的专属方案。

比如aiXcoder会根据客户已有代码与业务流程构建高质量训练数据，并通过轻量级微调技术实现模型能力迁移。“计算资源我们只用一到两张推理卡，也能让模型的微调结果达到甚至超过全参微调的能力，”刘德欣说，“我们的目标是让企业能用最低的代价训练出效果最好企业专有模型。”

此外，aiXcoder还独创了基于提示词的软件开发方案PBSD(Prompt-based Software Development）。该方案有别于传统的提示词工程，而是沿着企业的软件开发框架，以智能化的方式把企业内部那些支撑企业业务的海量基础业务代码找出来，并Prompt化，然后把这些Prompts以结构化的方式管理起来，帮助模型在生成时实时引用背景知识，提高了上下文命中率和准确率。

这种深度贴合客户业务逻辑的策略，让aiXcoder能快速进入客户的核心开发流程。

“敢去啃硬骨头的企业不多，而我们愿意去深入解决企业领域化的问题。虽然未来模型会替换，但这些沉淀下来的技术会持续发挥价值。”刘洋告诉「甲子光年」。

而在私有化部署与企业场景的打磨中，aiXcoder起步很早。刘德欣认为，许多企业在部署大模型时最大的难点是“搞不懂”、“训不转”、“学不会”，“企业私域数据的训练是大模型落地最关键也最难的一步，模型的训练和微调不是照着网上的教程去做微调就可以解决，而是要基于企业客户的实际业务情况，去帮他们灵活构建符合他们的Transformer模型和算法。很多人不是不想做，是没有工程和模型积累做不了。”

今年年初，在DeepSeek-V3/R1大模型发布后，aiXcoder第一时间接入了DeepSeek系列模型。不仅如此，基于多年软件工程领域的深厚积淀与实践，aiXcoder推出一套工程化、高效能的模型训练解决方案，帮助企业迅速落地DeepSeek并实现个性化应用，让AI真正成为企业内在驱动力。

而在C端，aiXcoder更侧重于为开发者提供工具产品。

aiXcoder推出了IDE插件，为个人开发者提供类似于GitHub Copilot的代码自动补全和生成能力。目前这一开发者版工具以免费基础功能为主，吸引用户和社区反馈，共同完成开发者社区生态的建设；未来计划加入高级功能并通过订阅变现。

4.AI编程赛道全球竞速与国产突围

2021年，GitHub推出的Copilot点燃了AI辅助编程的热潮。短短三年内，这款由OpenAI模型体系驱动的代码助手已经积累了数百万开发者用户，此前微软在7月公布的财报中透露，GitHub Copilot的年化经常性收入（ARR）达到3亿美元，占GitHub整体收入增长的40%。

技术迭代也在持续推动行业裂变。2024年崛起的Cursor可基于GPT-4、Claude 3.5 Sonnet等AI模型的深度学习能力，可实时预测开发者需求并成代码。据外媒信息，Cursor近期估值高达约100亿美元。同期Devin、Magic等新晋玩家尝试突破功能边界——前者探索多文件代码架构规划，后者引入Agent自动执行编译验证。

去年7月，Stack Overflow发布的2024年度开发者调查报告显示，76%的受访者表示正在或计划在开发过程中使用 AI 工具，较上年提升6个百分点；Stack Overflow还询问了开发者是否认为AI对其工作构成威胁，有70%的专业人士认为AI不会对他们的工作构成威胁。

去年底，美国AI独角兽企业Anthropic从用户与Claude的对话中随机选取了100万条，进行分析和总结后发现，用户在Claude.ai上的主要使用场景排在第一位的是网页和移动应用开发，占比为10.4%。Anthropic介绍，软件开发人员主要利用Claude执行调试代码、解释Git操作及概念等任务。

代码及开发领域由于具备高质量的数据、丰富的应用场景以及多样的用户人群，成为了AI应用落地的最关键的场景之一。Markets and Markets报告显示，全球AI编程工具市场预计将从2023年的43亿美元增长到2028年的126亿美元，预测期内复合年均增长率为24.0%。

图片来源：Markets and Markets

在AI编程赛道的全球竞速中，国产AI编程企业正通过差异化创新与生态协同实现突围。

而突破口在哪里？答案或许就是技术自主化和垂直场景深耕。

「甲子光年」观察到，目前AI编程的市场需求正在从“能写代码”转向“能交付特定任务”，aiXcoder在模型调优定制和行业适配方面下足了功夫，并形成了良好的落地效果，这就已经跑在了市场需求的前面。

刘洋判断，随着底层大模型的加速发展，智能编程的普及速度会“越来越快”，将有“越来越多的人、更多的企业开始使用这些工具”。他预计，2025年各家产品将会对标、追平Cursor的技术水平。“软件自动化是人们几十年来一直追求的。”刘洋表示。

刘德欣认为，未来几年可落地的市场规模每年以约30%的速度扩张是“比较正常”的趋势。

中国市场的广阔与特殊需求也给了aiXcoder机遇。国内开发者群体庞大，据自工业和信息化部的数据，我国的软件开发者数量已经突破940万，开源参与者数量排名位居全球第二。企业数字化转型对高效开发工具的需求迫切，而数据合规和本地部署要求也让海外SaaS难以多方位布局，此刻无疑是国产SaaS平台发展发展的黄金时期。

这次aiXcoder引入国有资本投资，除了资金支持，更是一种重要的背书，让aiXcoder在金融、军工等高安全需求行业客户中也获得了信任度。刘洋很感谢国资的注入：“这是对我们企业的肯定，也对后续开拓政府和国企市场是一个加分项。”

在“百家争鸣”行业爆发期，aiXcoder没有急于去“横扫C端”，而是围绕一个难而慢的问题：如何把AI嵌入到真实的企业开发流程中，做一名值得信赖的智能软件开发合作伙伴。

而AI编程赛道真正的竞争，或许从现在才刚刚开始。

（封面图来源：aiXcoder）

（文：甲子光年）

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

1. 最新推出内置MCP功能的软件开发领域Agent产品

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复