AI 应该上班,而不是上线

 

今天没有发布会,也没有任何的新产品,只是我看到了一组数据:

中国智能汽车销量 Top5 里,有三款搭载了面壁。

借这个,一起来聊聊今年来的 AI 落地的显著变化。

年初,DeepSeek 卷翻全球,各家大厂频繁发货,模型越来越强,但也越来越像“反骨仔”。

我们反复教 prompt、改提示、调温度,像是在“远程管理一个聪明实习生”。它会帮你回答、写点文案、润色语言,有时也能惊艳你。

但如果我们冷静看,会发现它AI总是在“被服务”——人类去不断指示、不断监督、不断兜底。

而真正的生产系统,需要是稳定干活。

一个转折点

一个月前,Manus 发布,把 AI 装进虚拟机,开始“真干活”;

昨天,智谱发布的「沉思」让本地电脑开始自己打工,完成了一个交代清楚、结构完整、能复用的任务

AutoGLM 沉思:AI 自己把活干

我们开始看到,大模型不再只是“接口”,而是“执行体”:不再 prompt in / answer out,而是感知任务,自主出手。

自此,我们对大模型的态度,发生了一些改变:从一个“被请求的接口”,变成了能感知任务、能主动推进的执行体。不是“听命行事”,而是“理解语境、直接动手”。

而当模型从“被动响应”走向“主动承担”,另一条更少被关注的路径,也正逐渐成形:模型开始不只是服务人,而是服务机器。 它不再是人类的助手,而是系统的一部分。

「上班」,而非「上线」

在很多语境中,“落地”意味着模型上线:模型调好,上传 Hugging Face,连个 API,就可以跑 demo 了。

真实系统里,“上线”远远不等于“上班”:“能用”,后者是“在用”,是模型在一个实际系统中持续运行,要接受稳定性监控、对接模态感知、支持中断恢复、容错控制、长时执行,并对输出结果承担责任

人想要的,是「助手来工作」,而不是工作助手

对于上班,要求的不再是一种“能演示”的状态,而是一种“要负责”的状态,看似微小转变,却是两套体系。在这个体系中,你可以不被模型惊艳,但它不能掉线。你可以不感知它的存在,但它必须稳定地在岗。

“模型上班”这一幕,已经在多个现实场景里悄然出现。其中最具代表性的,就是汽车。

车是第一站

回顾到最开始的新闻:

中国智能汽车销量 Top5 里,有三款搭载了面壁。

之所以说这个新闻很有趣,是觉得模型开始进入一个长时间运行、交互密集、资源受限、网络不稳定的物理系统。注意:这里的“车”,或不仅仅是 Car,而是更广义的“Vehicle”。

在控制系统的语境下,Vehicle 是一切“可移动、具备执行能力的人工系统”:潜水器、无人机、月球舱、巡检机器人、采矿平台、轨道维修车……都是 Vehicle

模型会进入各类 Vehicle:各类载具

它们的共同点是:

  • • 网络不可依赖,模型必须离线运行;
  • • 人类无法兜底,模型必须稳定决策;
  • • 环境极其复杂,模型必须具备多模态感知与判断能力。

如果说智能汽车是模型走进物理系统的第一站,那这些更广泛的 Vehicle,才是真正的大规模上场。

为什么对讲机没被淘汰?

在线下聊天时,我经常拿出一个类比:对讲机

很多人以为智能手机已经什么都能干,对讲机这种设备早该退出历史舞台了。

而在任何一个施工现场、矿井、铁路、应急系统,主角依然是对讲机。

因为对讲机不需要信号,不用开 App,没有延迟,没有系统弹窗,它开了就能说,说了就能听,永远可用。当你面对的不是“信息获取”,而是“任务执行”,你就不再追求“多功能”,而追求“不中断”

施工现场、矿井、铁路、应急系统,主角依然是对讲机

这正是大模型走入系统之后,需要面对的现实。它不再是一个“能对话”的工具,而是一个必须完成工作、不掉线、不宕机的部件

大模型需要一套“对讲机级别的方案”——小巧、坚固、可靠、全离线。

在沙漠、在车舱、在井下、在太空,它可能不能联网,也不允许等待。它要常驻系统、听得懂现场、做得出反应,并且错不了

面壁在做什么?

面壁是一个很有意思的公司,也是国内最早探索 Agent 落地的公司之一。早在 2023 年,面壁便联合 OpenBMB 及清华大学 NLP 实验室,开源的大模型+Agent 项目 ChatDev

反倒是今年,在 Agent 成为热点的语境下,你很少看到面壁高调参与这场叙事。没有“Agent 平台”发布,没有“自动化链路”路线图,也没有各种看起来很繁忙的 DAG 图、任务计划器和工具调用框架。

很多人会好奇,面壁去哪了?之前,我有呓语写到:

面壁和硅基流动,完成「DeepSeek 后,第一批的生态锚位」,并都拿了华为的投资:把各种最优秀的模型,部署在国产设备上

而今天,这份呓语开始兑现:

面壁,把 Transformer(大模型),装进了 Transformer(变形金刚),让物理设备成了 Agent 本身

小钢炮超级助手 cpmGO,首个纯端侧智能助手

不做声明,只做部署,去解决更为真实的挑战:让模型长期在设备里运行、离线推理、实时控制,它该如何被训练、被剪裁、被评估、被信任。

于是,这家我本认为在做手机模型的公司,已与一汽大众、长安、长城、上汽、德赛西威、中科创达等企业达成合作,共同推进模型在车上的更广泛落地。

安全,是最大的豪华

我们太习惯了用“聪明”来评价 AI。但真正的系统,不是看它能说多少话,而是看它能不能持续工作。

在系统中,真正有价值的 AI,不是最能生成内容的,而是最少出故障的;不是能回答一千个问题,而是能干好一个任务。你可以容忍它答错一道冷门题,但你不能接受它误识别障碍物、延迟控制一秒、把空调温度调到极值。

在前两天文章里,我也表达过类似观点:参数大,不等于能力强;体积惊人,也不代表能稳定上岗。真正衡量一个模型的,不是“它能不能答题”,而是“它能不能干活”。

——《大,就聪明吗?论模型的尺寸虚胖》

在这种情形下,我们不再关心调用频次、响应速度、能力维度,而是关心它是不是能长期稳定在岗。不是“谁调了模型”,而是“模型在不在系统里”;不是 token per second,而是 uptime per day

“安全,是最大的豪华”

“安全,是最大的豪华”这句话原本属于汽车行业,现在也属于大模型。它不响、不火、不热搜,但它在你真正需要它的那一刻,必须在岗,而且不能错。

成为世界的一部分

当模型走出 PPT,跑去矿井、隧道、舱室、轨道系统中静默运转——它就不再是“技术的新鲜感”,而是“系统的一部分”。

当我们从“能不能回答问题”转向“能不能值一班岗”,大模型的主语就变了:模型不再是供人调用的工具,而是和设备一起驻留、与系统一同运行的执行体。它要理解上下文,适应环境变化,随时准备接管操作,随时能够承担后果。

未来属于谁,我们还不知道。但可以确定:未来不属于那些只会概念炒作、从不解决现实问题的方案。

但我相信:谁在真正干活,谁就留下来


最后,以一个很切题的宣传片,作为收尾:

人与AI共同奔赴的,英雄主义

 

(文:赛博禅心)

欢迎分享

发表评论