允中 发自 凹非寺
量子位 | 公众号 QbitAI
当城市天气预报有望精确到街镇,每条马路都可能拥有“独家预报”——这并非科幻场景,而是上海“扶摇”气象大模型带来的突破。
近日,由上海科学智能研究院(下称上智院)与上海市气象局等联合研发的国内首个聚焦超大城市安全的AI气象预报模型正式亮相。
其空间分辨率较传统模式提升3倍至1公里,推理速度从10分钟压缩至3秒,犹如为城市装上精准感知天气脉动的“数字神经”。

作为聚焦短时强降水、雷雨大风等中小尺度灾害性天气的AI“哨兵”,“扶摇”通过融合雷达、卫星、数值预报等多模态数据,率先实现区域级端到端预报闭环,将在今年汛期构筑起守护城市安全的新防线。
据了解,上智院致力于以人工智能驱动科学研究范式变革、赋能千行百业。位于上海徐汇西岸的这个战略性新型研发机构,通过与高校形成深度协同,链接产学研各界进行全链条创新,正在重构生命科学、物质科学、地球科学等重大领域的科研法则,给产业场景中的关键科学问题提供创新思路和解决方案。
当内蒙古乌兰察布与上海之间横跨1500公里的云上智算平台CFFF全速运转,当40 PFlop/s算力构建起数字时代的“战略粮仓”,漆远以“双院长”身份(上智院院长、复旦大学人工智能创新与产业研究院院长)架起桥梁,将CFFF智算平台的算力优势与上智院的创新策源能力深度融合。如今,上智院与复旦大学等高校的协同效应开始显现,各领域的科研在AI的全方位赋能下正驶向范式变革的创新大陆。
算力普惠:从单科精进迈向系统创新
这场变革始于一场破界行动。
2021年,时任蚂蚁集团副总裁、首席AI科学家的漆远选择回归学术界,以复旦大学浩清特聘教授身份开启新征途。作为复旦大学人工智能创新与产业研究院创始院长,在学校的大力支持下,漆远不久后牵头启动了CFFF(Computing for the Future at Fudan)的建设,与阿里云、中国电信等合作伙伴共同攻坚国内高校最大的云上智算平台。

△漆远在复旦大学2024级新生开学典礼上作为教师代表发言
2023年6月,横跨1500公里的云上智算平台CFFF正式上线——内蒙古乌兰察布的“切问”一号与复旦江湾校区的“近思”一号通过光纤同频共振,以40 PFlop/s算力总规模、超千卡并行计算的硬核配置,在生命科学、量子化学、大气科学等战略领域构筑起前沿阵地。
此时,在统一部署下,上智院的科研布局已悄然成型:CFFF平台的异构计算架构设计成为上智院联合复旦大学攻关科学大模型的核心计算底座。随着2024年张江存储机房投用,新增8PB温存与25PB冷存,CFFF平台构建起了数字时代的“战略粮仓”。这一中国高校最大的异构智算集群,不仅是AI时代学科融合变革的“算力重器”,也构筑了上海市科学智能实现跨越发展的先发优势。

△CFFF“切问”一号

△CFFF“近思”一号
复旦大学恒温机房里的成排黑色机柜正吞吐着颠覆性的科研图景:台风路径预测与蛋白质折叠模拟共享算力资源,基因编辑试错与大气污染溯源共用AI引擎……这种看似“无序”的学科共栖,恰是CFFF设计的精妙之处——平台不仅能支撑千亿参数大模型训练,如今更串联起覆盖10余学科的80余种科研算子,让AI工具链渗透进每个科研毛细血管。
截至2024年底,这套“科研神经系统”已链接全校51个院系单位的近4000名用户,支撑多篇CNS正刊、百余篇顶刊论文和百余个国家级项目,并斩获中国高校算力案例评选榜首。
一组数据揭示着效能革命:GPU使用率跃升至95%,HPC资源利用率达90%,25Gb/s极速网络让1TB数据跨机房传输仅需10分钟。更深层的改变在于创新文化的嬗变。CFFF平台通过多层次的培训体系,覆盖了2700多名师生,促进了学科交叉和联合研究。
正是这种体制机制创新的土壤,孕育出打通学科壁垒的关键变量。2023年9月,上智院正式启航,成为科学智能创新策源的战略支点:它既非传统高校实验室的纯学术研究,亦非产业界快速落地的项目导向,而是以AI为催化剂和通用技术,链接产学研各端进行全链条创新,将临床病例、大气模拟、蛋白质结构这些“科技方言”编译为人工智能的通用语言。

△位于上海西岸的上海科学智能研究院
核心攻坚:“破壁”垂直领域科学大模型
伏羲气象大模型、女娲生命大模型、燧人物质大模型……在上智院,这些以华夏文明始祖命名的垂直领域科学大模型,承载着用人工智能破解高价值产业场景中的关键科学问题的使命。
伏羲气象大模型的实战价值在2024年超强台风“贝碧嘉”的预测中得到验证。当多数机构预测台风将在浙江台州到江苏启东一带沿海登陆时,该系统提前5天锁定上海浦东为最可能登陆点,并通过每6小时更新的动态预报持续修正轨迹。
除了针对未来15天的中短期确定性预报,“伏羲”同时还研发了集合预报,即可以进行概率预报。自诞生以来,它已在上海中心气象台、国家气象中心、香港天文台、欧洲中期天气预报中心等多个机构业务化运行。根据全球权威机构欧洲中期天气预报中心的实时运行评测,目前“伏羲”是已有模型中综合预报精度(ACC和RMSE)最高的模型。
面向产业,“伏羲”已与中国太平洋财产保险股份有限公司、中国远洋海运集团有限公司等企业合作,为防灾减灾、远洋导航提供气象支持,同时应用于光伏、风电的出力与调度优化,提升新能源运行效率。

△在中国气象局开展的人工智能天气预报大模型示范计划中,伏羲气象大模型三项综合评测指标均排名第一
以生命科学的微观基因蛋白等分子以及宏观表型两大基础场景为抓手,女娲生命大模型致力于为基因创新药研发、蛋白动态设计、数字孪生诊疗等产品平台提供基础模型能力,打破传统遗传调控、生物力学计算模式,实现跨越式的生命状态预测。
siRNA(一种短链的RNA分子,可有效抑制致病基因表达,比传统药物合成难度更低、靶点更广泛)的底层生物机制——RNA干扰机制研究曾获得2006年诺贝尔生理学或医学奖,其药物研发是全球范围内极具潜力的前沿医药领域。“女娲”团队打造了全球首个大规模siRNA药物数据库,包含超过30万条化学修饰的siRNA数据,涵盖45个治疗靶点,为siRNA药物研发提供了重要支持。在数据库的基础上,团队构建了一个AI模型,用于对siRNA药物进行虚拟筛选,在实验验证阶段将多靶点药物的疗效预测误差从40%降低到了8%。

△女娲生命大模型的siRNA药物沉默效率预测服务
燧人分子基础大模型聚焦物质科学的核心挑战,致力于构建理解分子世界的通用工具。该模型利用最大的第一性原理数据库QO2Mol进行训练,旨在解决材料科学中的基本问题,支持石化、能源和制药等行业。
在电池研发领域,模型构建了929个分子的潜在筛选库以训练生成模型,加速锂电池电解液新型配方的探索;在环保材料方向,其从700多万种虚拟分子中筛选出满足各项性能要求的可持续高分子材料单体,助力提升一些常见材料的降解性能、降低环境污染。药物研发则是另一重要应用场景,通过AI与计算方法的结合,团队一个月内发现某难成药靶点的动态结合口袋(传统实验室或Alpha Fold3难以捕捉),并筛选出实验验证的活性分子。

△燧人分子基础大模型在四大核心指标上全面超越了业界主流的Max Welling团队提出的EDM模型
面向复旦大学的文理医工“四轮驱动”和新工科建设,双方的协同创新最近在复旦大学附属中山医院心内科落地开花。
“技术的爆发式发展远超预期。”中国科学院院士、复旦大学附属中山医院(下称中山医院)心内科主任葛均波在2月份的“观心CardioMind”发布会现场感慨道,“当年我们讨论的还是AI能否理解医学知识,如今它已经能够深度参与疾病诊断和临床决策。”
这个专攻心血管的“数字专家”是国内首个深耕心血管专科的医疗大模型,由中山医院与上智院-无限光年联合实验室共同研发,输入了中山医院心内科积累的数十万份电子病历,更消化了顶尖医生的诊疗逻辑:从常规疾病指南到“名院大查房”提炼的疑难病例经验,都被转化为结构化知识库。系统突破单一文本分析桎梏,实现心电图、超声影像、实验室检查等多模态数据整合推理,其亚专科知识库精准覆盖冠心病、心律失常、心力衰竭等核心领域。

△葛均波在“观心CardioMind”发布会现场
在与全球变暖速度的赛跑中,科学家们亟需更强大的工具——既要精准预测格陵兰冰盖消融对上海海平面的影响,也要量化碳关税政策对长三角制造业的冲击,甚至预判气候难民潮可能引发的地缘政治动荡。
这些复杂议题跨越自然与社会两个系统,也对气候科学模型提出了更高要求。由复旦大学校长助理、上智院理事长吴力波领衔的 Planet Intelligence@Climate(简称PI@Climate) 团队正在探索一种新的解题方式——用大模型理解气候,用智能决策应对未来。
PI@Climate 是中国首个基于自主知识体系构建的气候科学大语言模型,由复旦大学、上智院、上海创智学院联合研发。它打破了传统模型对单一学科的依赖,融合农学、林学、法学、经济学等十余个领域的专业数据,持续进行训练与微调,形成了一个覆盖气候变化科学事实、自然与社会系统影响、减缓与适应路径等核心主题的高可信度领域模型。
“作为一个面向气候垂类的大语言模型,PI@Climate比底座模型或通用大模型更擅长解决具体的专业科学问题。”吴力波说。当通用模型面对“冻土消融对碳汇的影响”仍语焉不详时,PI@Climate 已能综合水利工程模型与环境法规条文,为科研或政策提供可执行的决策分析支持。
同时,团队构建起一套包含7777个多学科问题的评测体系——PI@Climate Benchmark,为气候领域内的大模型能力验证提供系统依据,反哺领域模型的发展。

△吴力波在PI@Climate发布会现场
传统台风路径预报的背后,是气象学家在“千万维度迷宫”中的艰难探索。以欧洲中期预报中心每日运行51次扰动预报为例,这种预报方法就像派出51支探险队,在由温度、气压、风速等千万个变量构成的“天气迷宫”里自由搜索。这种战术不仅耗费海量超算资源,而且由于有限预报样本显著增加了预报决策的难度。
针对这一痛点,中国科学院院士、发展中国家科学院院士、复旦大学特聘教授穆穆及其团队的青年研究员冯杰等联合上智院提出双重破局路径。在理论层面,研究论证了基于误差演变规律的扰动方法,结合伏羲气象大模型的高效预报的优势,或能以低于1/100的成本生成更优台风路径概率预报产品,为气象预测从“动力穷举”转向“智能降维”提供理论支撑。在技术层面,团队开发VI-CNOPs智能算法,像经验丰富的导航员般,通过分析历史数据自动生成最优扰动策略。新方法在模拟测试中较传统方法的预报优势随时间推移持续扩大。
两项成果于近期发表于权威期刊npj Climate and Atmospheric Science和Quarterly Journal of the Royal Meteorological Society,形成“理论-技术”闭环,为高精度、大样本的集合预报提供极具潜力的解决方案。

△穆穆为大气与海洋科学系学生授课

△冯杰为大气与海洋科学系学生讲授AI的气象应用
在科技与文化交融的背景下,AI技术凭借跨领域优势为人文社会科学研究注入新动能,成为传播中华文明的重要力量。复旦大学国家发展与智能治理综合实验室(下称实验室)联合上智院,聚焦考古、古文字、早期典籍和古代历史地理四大支柱领域,开展中华文明大模型研究,推动以人为中心的研究范式转型。
该项目突破传统“透物见史”视角,着重解析人与人、人与物、人与环境的多维互动关系,构建契合中华文明价值观的大模型体系。作为项目总负责人,复旦大学副校长、实验室主任陈志敏强调,中华文明的传承创新是我们共同的使命,源流的追溯重建过程中AI技术可以发挥多个方面的关键作用。
依托深厚的人文社会科学底蕴,复旦大学正探索AI助力新文科建设提质增效的方向。由实验室牵头,联合上智院与德勤中国编撰的国内首部AI与人文社会科学结合领域的全面报告《未来已来——人文社会科学智能发展蓝皮书》(下称《蓝皮书》),汇集53位专家智慧,系统梳理AI与人文社会科学融合的理论前沿与技术挑战。
《蓝皮书》主编吴力波指出,区别于自然科学,人文社会科学的研究对象是人类行为,规律验证难度更高。该报告致力于通过AI技术解构社会复杂系统特征,精准刻画主体间关系网络,从而更好地进行预测以及部分证伪。

△主创团队代表共同发布《蓝皮书》。陈志敏、吴力波、胡安宁、吴肖乐、周葆华、文少卿、严峰、尤忠彬。
在AI技术深入千行百业的当下,复旦大学人工智能创新与产业研究院教授徐增林带领团队立足共性技术,与上智院合作打造了一套“算法工具箱”,为AI技术的安全可信与效率提升筑牢根基。
在联邦学习领域,针对数据分布不均导致的模型泛化难题,团队通过改进加权聚合与客户端选择策略,显著提升模型在未参与训练客户端的表现,为医疗诊断、金融风控等隐私敏感场景提供更稳定的技术支撑。面对电商平台的海量数据处理需求,团队开发的EAVE方法通过轻量级稀疏交互设计,将属性值提取效率提升30%,成为优化商品管理的利器。在多模态学习领域,M2PT方法以更低计算成本释放多模态大模型的零样本学习潜力,为智能助手、自动驾驶等应用注入泛化能力。而针对异质图学习的M2M-GNN模型,则在社交网络分析、药物研发等领域展现出精度优势。
这些技术突破,成为构筑AI“安全-效率”双引擎的核心组件,每一项成果都在回应AI落地的本质矛盾:如何在开放协作中守住安全底线,在算力约束下释放最大效能。

△徐增林在上智院与前来交流学习的复旦大学学生探讨可信AI
生态基座:从工程优化到开放协作
“要全面推进AI4S范式变革,必须坚持深耕垂域,系统整合算法、算力、语料,真正做一盘‘番茄炒蛋’,而不是拼凑一锅‘番茄+白煮蛋’。”中国科学院院士、复旦大学校长金力在今年全国两会上的发言,对复旦大学发展科学智能的思路做了形象概括。
这一理念在2025全球开发者先锋大会上得到了共鸣——漆远用“土壤、水分、阳光”的生态比喻,强调基础工程设施如同土壤、领域知识如水分滋养、复杂推理模型似阳光赋能,三位一体的开放共生将大力推动高校和企业的发展。
当DeepSeek大模型将训练成本压缩至传统方法的1/10、推理成本降至每百万token一元时,背后是低秩分解技术削减参数冗余、通信计算并行化提升资源利用、GPU/CPU异构调度打破工具枷锁的工程突破。燧人分子基础大模型研发中,团队重构基于CPU架构的计算工具包,迁移到GPU/CPU混合架构上,使分子动力学模拟效率提升10倍,直接节省90%计算成本。“算法像思想,而没有工程就没有‘肉身’”,漆远如是说。
这种突出工程和开放的系统化思维正驱动上智院与复旦大学共同构建科学智能的生态基座。相对于Deepseek这样的大语言模型,垂直领域科学大模型更多样化,尤其需要工具链和数据平台的支持。
上智院联合复旦大学与科创公司无限光年打造的一站式AI4S特色智算软件平台,如同科研版的Cohere,集平台、模型和应用工具于一体,可服务多家高校与科研机构。工程层面的开放协作有效助力了科研模型的开放服务。如今,平台已集成DeepSeek、AlphaFold3、伏羲气象大模型、燧人物质大模型、女娲生命大模型等前沿模型,并完成6家国产GPU与10个领域模型的深度适配。接下来还将为复旦百模计划提供技术支持,通过国产适配支持复旦产教融合平台落地应用,并提供科学智能Agent系统、支持复旦科研场景流程智能化需求。

△一站式AI4S特色智算软件平台
如果说工具优化是掌控火候,那么数据治理就是精选食材。双方共建的科学语料平台作为另一块基石,在复旦大学人类表型组研究院执行院长田梅团队与复旦大学附属华山医院核医学科副主任左传涛团队手中具象化为NasalSeg——全球首个鼻腔3D CT开源数据集。
现代医疗中,颌面外科手术高度依赖CT影像来分析鼻腔与鼻旁窦的结构。然而,传统的手工分割方式就像医生在CT图像上“雕刻”鼻腔组织,不仅费时费力,还可能因医生间的差异导致标注不一致。因此,自动化分割成为AI医学影像研究的一大关键方向,但该领域一直缺乏公开的高质量数据集。
为了解决这一问题,田梅团队与左传涛团队推出包含130例高精度像素级标注的CT扫描数据的NasalSeg,覆盖左/右鼻腔、鼻咽部及左右上颌窦共五个关键解剖区域。相比于过去的私有或小规模数据集,NasalSeg的标注数据量提升了一个数量级,为AI训练提供了更标准、更丰富的“教材”,让算法更高效地学习自动分割。未来,NasalSeg将助力鼻内镜手术机器人、智能影像分析系统等临床工具的发展,帮助医生更快、更精准地制定治疗方案,减少患者等待时间。

△田梅在上智院面向人类表型组大科学计划相关专家学者介绍交叉研究工作

△左传涛在复旦大学附属华山医院
科学语料平台于2024世界人工智能大会首度公开亮相,具备从数据采集、加工到管理和建模的全链路能力,保证数据的高效加工、可信和安全互通。目前,平台已汇聚超10PB高质量科学数据,正在催化多学科突破——人类表型组研究院通过血管几何数据重构血流模拟流程,将心血管流体力学计算效率提升5倍;生命科学学院完成50TB人类基因组数据采集,较传统方式缩短40%耗时;人工智能创新与产业研究院实现蛋白质-药物对接效率10倍跃升,并生成业界首个1纳秒动态蛋白质结构数据。这些标准化“数据食材”通过科学语料平台的智能清洗与增强,让全球研究者得以专注“番茄炒蛋”的“烹制”。

△科学语料平台
从内蒙古乌兰察布的“切问”超算集群到起源于上海的高质量科学语料平台,从守护隐私的可信AI到垂直领域模型的“万能适配”工具链,这些基座工程正在书写新的科研生态叙事。
站在科学智能爆发的潮头,漆远为这场变革写下新的注脚:科学智能的发展,始于对“土壤、阳光、水分”的系统培育,成于开放生态中迸发的集体智慧。
作为科学智能生态的基础设施和关键节点,上智院的AI科学家、AI工程师和高校机构的领域科学家携手前行,擘画前瞻蓝图,着力构建更加完善、更具包容性的科学智能生态系统,实现算力、算法、数据更大规模的整合与提升,为科学智能下一个爆发式发展注入强劲动力。

*本文系量子位获授权刊载,观点仅为原作者所有。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
🌟 点亮星标 🌟
(文:量子位)