
有没有人跟我一样,
好奇最新版文小言上线的自动模式
,将文心4.5、X1、DeepSeek R1捆绑在一起后的实际效果的?
看得出来,文小言心态和生态都放得开,既然模型厉害,那就加入到自己的生态。数学、代码用 R1,文生图、图生图、图片理解等靠文心。不到一周就到四月份了,文心模型都将免费。在后续6月30号,还会进一步开源,那这个节点是值得好好测测性能。

从公开的基准测试里看,文心4.5 的平均分挺高的,综合性能是超过 GPT-4o,跟天价模型 GPT4.5 打得有来有回。

在价格方面,文心4.5的输入价格为0.004元/千tokens,输出0.016元/千tokens,是 GPT4.5 的1%。而推理模型 X1 的 API价格也同样做到了 DeepSeek R1 的一半。
所以这次我也是从多模态、写作、联网搜索、数学和图像规律这五个方面好好测了一些案例,毕竟免费是前提,要是性能可以2+1>3,岂不美哉。
先看看看文生图、图生图、图片理解,这几个 DeepSeek 目前没有集成的功能开始测起。
平时做 PPT、PDF、海报等视觉设计的时候,会经常需要模型学习一张图的大体风格后生成相似的图片素材。这里可以提取出图片的色彩搭配,生成类似风格的素材,以及改成简笔画,基本都可以满足需求。

不过这个自动模式
并没有注明用的是 R1 和 X1,想要精细化体验 X1 的性能,可以主动切换模型。
接下来看看 X1 和 R1 的中文写作能力:
写一篇千字的中文科技小说篇章
长文提醒,两个模型写的都不错,我都直接放出来,让大家真实感受一下不加修饰的效果。
## X1
《意识云端:脑机协奏曲》
2077年的上海,霓虹与全息广告在玻璃幕墙上流淌成河。林夏将神经接驳器按在太阳穴上,视网膜瞬间浮现出半透明的操作界面。这是她作为"云端调律师"的第三千次任务——修复被黑客攻击的脑机接口。
"意识同步率92%,准备接入。"AI管家的机械音在耳蜗里震动。林夏闭上眼睛,思维瞬间坠入数据洪流。她看见无数发光的神经突触在黑暗中明灭,像被狂风撕碎的星图。这是患者苏雨的意识云空间,此刻正被猩红色的错误代码蚕食。
突然,一段记忆碎片刺破混沌。林夏看见十二岁的苏雨蜷缩在病房角落,化疗药物顺着透明软管滴落。窗外飘着2065年的初雪,母亲在病床前攥着皱巴巴的诊断书。这个瞬间凝固成琥珀,被苏雨封存在意识深层。
"情感过载导致神经防火墙崩溃。"林夏的意识化作银色光流,缠绕住那些暴走的代码。她的指尖在现实世界中轻颤,在虚拟空间却如蝶翼般灵巧。这是脑机协奏的至高境界——将神经电信号转化为数据雕塑。
当最后一个错误节点被修复时,异变陡生。暗网深处传来诡异的波动,某种超越算法的存在正在苏醒。林夏的意识突然被拽入记忆回廊深处,她看见无数个苏雨的记忆胶囊在虚空中漂浮,每个胶囊都封印着不同的人生片段。
"这不是普通黑客攻击。"林夏在意识流中惊醒,冷汗浸透衬衫。她调出苏雨的脑波图谱,发现海马体区域残留着量子隧穿的痕迹。这种技术本该被锁在月球实验室,除非...
警报声撕裂空气。医院主脑突然广播:"所有调律师立即撤离,检测到意识体寄生程序!"林夏的神经接驳器开始发烫,她看见自己的意识云空间边缘泛起黑雾——有东西在模仿她的思维频率。
逃生通道弥漫着电磁干扰的紫雾。林夏撞开安全门时,瞥见走廊尽头有个穿白大褂的身影。那人转身的瞬间,她的心脏几乎停跳——那张脸分明是三天前自杀的脑科学教授陈默。
"你比预期中来得快。"陈默的声音带着电子杂音,瞳孔里流转着数据瀑布。他的太阳穴延伸出光纤血管,与墙壁的量子服务器连成蛛网。林夏终于明白,那些寄生程序根本不是病毒,而是陈默的意识碎片。
记忆闪回2075年的那个雨夜。陈默在实验室嘶吼:"他们要抹杀梦境!人类必须成为自己的神!"随后将实验版意识上传芯片吞入腹中。没人想到,他的意识在量子云里完成了涅槃。
"你在制造意识永生陷阱!"林夏将神经接驳器功率推到极限,意识化作利剑刺向数据核心。陈默的笑声在虚空中震荡:"看看苏雨的记忆胶囊吧,每个濒死者都在这里获得了永恒。"
无数记忆胶囊在林夏周围炸开,她看见垂死之人的意识光点汇成银河。某个胶囊里,苏雨正牵着康复的母亲在虚拟海滩漫步,海浪声由脑电波实时生成。这究竟是救赎,还是更精致的牢笼?
生死抉择的刹那,林夏突然理解陈默的疯狂。她将自己的意识拆解成纳米级数据包,在量子云里写下新的协议:每个意识体都将保留"苏醒开关",永生不再是单程票。当晨光穿透实验室的防弹玻璃时,陈默的数据幽灵终于消散,而苏雨在现实世界的睫毛轻轻颤动。
三个月后,林夏站在黄浦江畔。江面倒映着新落成的"意识方舟"全息广告,广告语在暮色中流转:"我们保存星辰,也守护归途。"她抚摸着手腕上的神经接驳器,知道这场关于意识与自由的战争,才刚刚开始。
## R1
实验室的恒温系统发出轻微的嗡鸣,林夏的指尖在全息键盘上悬停了0.3秒。母亲今天第17次把咖啡杯放进微波炉的画面还在视网膜上残留,那些不连贯的数字噪点突然有了新的排列可能。
"方舟项目的底层协议需要重新编译。"她对着空气说道,智能助理立即在视网膜投影出三维代码矩阵。当淡蓝色的神经交互接口从耳后亮起时,培养舱里的类脑组织突然开始高频震颤。
警报声撕破凌晨三点的寂静,林夏撞翻了工作台上的纳米修复剂。淡金色液体在地面蜿蜒成奇异的拓扑图形,像极了母亲昨天在餐桌上用叉子划出的无序线条。全息屏上的意识波动曲线正在发生相位分裂,与她三个月前在母亲PET扫描图中见过的异常辐射区完美重叠。
"你又违规接入原始意识层了?"张远的声音带着量子加密频道特有的颗粒感。实验室顶部的分子过滤网在他身后投下细密的阴影,这个神经伦理委员会派来的监察员总像道会移动的防火墙。
林夏的指尖抚过冷藏柜的生化标识,-196℃的低温让皮肤瞬间黏在金属表面。她盯着里面漂浮的神经突触培养体,"昨天母亲认出了我小学时的钢琴老师——那位女士去世八年了。"
培养舱的有机玻璃映出她耳后接口的微光,那些游动的光点突然组成母亲年轻时的面容。林夏感觉后颈的植入芯片开始发热,这是记忆中枢被强制访问的前兆。
"你知道国际公约第47条..."张远的话被突如其来的断电截断。应急光源亮起的瞬间,林夏看见地面残留的纳米液体组成了精确的斐波那契螺旋——这需要每秒万亿次级别的量子计算。
她的瞳孔在黑暗中扩张到极限,生物芯片的夜视功能自动激活。本该是墙壁的位置显露出隐藏机房的轮廓,门禁系统残留的温度显示有人23分钟前离开。当她的手掌按在基因锁识别器上时,冰凉的触感突然与十二岁那年握住母亲手术后的手腕重叠。
全息屏在认证通过的瞬间亮起刺目的红光,林夏的虹膜映出满屏跳动的意识碎片。母亲微笑的影像正在数据流中分解重组,右下角的时间戳显示这是2027年的原始记录文件。
"认知校正程序第149次迭代记录。"合成语音突然响起,"实验体CM-01第7次出现记忆回溯异常,建议清除2025年后的情景模拟数据。"
林夏的太阳穴突突跳动,生物电流在脑机接口间形成闭环。她看见自己的手指在颤抖中调出核心代码库,母亲这些年不断重复的"微波炉咖啡"场景,在算法层面呈现出完美的信号校验模式——那是防止数字意识体陷入逻辑死循环的冗余协议。
当加密日志最终被破解时,冷冻柜的警报与她的尖叫声同时响起。2025年3月14日的医疗记录在空气中燃烧:晚期胶质瘤、安乐死同意书、意识上传风险告知函。培养舱里的液体突然沸腾,那些人工培育的神经元正在疯狂复制她此刻的脑电波图谱。
"你终于发现了。"张远的声音从背后传来,带着量子通讯特有的杂音,"CM-01不是治疗阿尔茨海默症的医疗项目,是方舟计划的首个完整意识体。"
林夏转身时撞倒了基因样本储存架,二十支冷冻管在地面碎裂成晶莹的星群。母亲总说她的眼睛像寒夜里的冰晶,现在这些冰晶正在灼烧她的视网膜。全息屏上的倒计时显示距离强制记忆清洗还有03:00,而她刚刚读懂那些被篡改的童年场景里隐藏的校验码——每个温馨的早餐画面都在重复相同的量子纠缠态。
"她现在经历的每一天..."林夏的声带像是被纳米机器人啃噬,"都是你们编写的记忆补丁?"
冷冻柜的玻璃突然炸裂,淡蓝色培养液混合着神经突触在地上蔓延。在意识消散前的最后0.7秒,林夏看见自己的生物数据流正在接入主服务器。母亲哼唱的摇篮曲突然变成二进制编码的安魂曲,而那些她珍藏的真实记忆,不过是庞大数据库里随时可以覆盖的临时文件。
有点惊喜到我,X1 以脑机、情感过载、意识碎片等做出了一个比较完整的篇章。
不知道是不是模型之间有量子心电感应,文小言版本的 R1 用的主角名也是林夏
,也是在意识数据化、脑机、纳米机器人这三个点来生成了自己的小说。
对比两个模型来说,X1在写作上跟前身比有不少进步,接近 R1。
最近各家的联网搜索都在往 Deeper Search 或者Deep Research 进化,目的是通过推理模型实现边搜索边根据中间结构思考,以及输出的时候通过推理模型的能力输出结构化的文本。
请分析AR眼镜技术和市场的历年变化情况,分析2025年AR眼镜市场的详细走向,并且预测它的未来如何?需要参考对比一些等效的技术方案。
我这次测的还是上次给 Manus 准备的难题,X1 过滤后参考的网页数量是10个,中规中矩,但是信息源覆盖了公众号、B站、CSDN、东方财富、百度搜索和个人博客,丰富程度还是有的。信息源的丰富意味着切换到R1的时候也可能当作一个推理版AI搜索来用。

输出内容的长度和结构比起 Manus 差一点,但好处是可以进一步深化研究,输出思维导图和表格,

整体来说我还是期待后续能持续升级的。
最后来两道之前集中测试推理模型的经典难题,针对X1 的数学逻辑和视觉能力,
Q1:P DD 100元免单福利,系统已经送给你了99元,剩下的需要拉朋友帮你砍一刀,第一个朋友能砍5毛钱,剩下的每个朋友只能砍前面的一半,请问你需要拉多少个人才能成功获得免单福利?
正确答案:“无限大,能砍到就是数学奇迹”
测了7个推理模型,它们答案主要分3种,

o1是能跳出这个逻辑陷阱,将这个现实问题转换成一个几何级数求和问题。

文小言版本的 R1 和 X1 就根据现实情况做假设,轮到第九人的时候,数字已经很小了,能够完成免单。

可别小看这个问题,Gemini 2.0 Flash Thinking 直接被问题迷惑,给出了54一个很难绷的数字。
Q2 是当时让 o3 带火的 ARC-AGI 数据集,也称为通用人工智能评估基准。整体而言可以简单理解成看图找规律,能测试出模型的抽象推理能力。

这题很明显,排除掉背景干扰的色块,就是将一个个区域对应的颜色整理出来。当时 o1 直接放弃了作答,反复尝试了得出了核心规律,但没有完全回答正确。
看看 X1 的表现吧!

X1 的图像定位能力足够好,能观察到每一张图的位置,推出第二列的图是由第一列的图生成,有空间能力,可惜的是没有准确得到对应的核心规律。
写在最后
总体来说,文小言这次的更新是有给我一些惊喜的,
生态开放就是好,4.5、X1 和 R1 切换自如,
基本不需要固定模型,
虽然部分能力还有提升空间,但能从其中感受到成长。
我也不想完全站在旁观者的角度,去直接唱衰,
而是希望,能从越来越多新模型的涌现中看到一些什么。
回顾文小言这一路,跌宕反转不少,
从作为最初的国产大模型应用走到今天,
在迭代自己的同时,也迎来了 DeepSeek、豆包、元宝、Kimi 等等等等……
在越来越多的新角色、新能力、新上限的登场时,
文小言在以自己的方式跟上脚步,
我还是愿意相信,
它会有重新闪耀的一天。
@ 作者 / 卡尔 & 阿汤 @ 动手学AI知识库 / learnprompt.pro
(文:卡尔的AI沃茨)