智谱又开源啦!附一手详细实测!同时还精准狙击了CloseAI的4.1!

↑ 点击蓝字 关注极市平台
作者丨刘聪NLP
来源丨NLP工作站
编辑丨极市平台

极市导读

 

没等来Qwen3开源,先等来了智谱开源! >>加入极市CV技术交流群,走在计算机视觉的最前沿

然后今天closeai也是发布了新模型,gpt4.1,笑死了,先发4.5再发4.1,不过依旧闭源。

反观,国产大模型真实太卷了,即Llama4倒下之后,感觉国外的开源已经没落了,而国内开源蒸蒸日上!雄起!

本次智谱开源了9B和32B两个尺寸级别的模型,共计6个模型,GLM4-9B-0414、GLM4-Z1-9B-0414、GLM4-32B-Base-0414、GLM4-32B-0414、GLM4-Z1-32B-0414、GLM4-Z1-Rumination-32B-0414。

其中,Z1为推理模型、Rumination为沉思模型、Base为基模。注意:沉思模型相较于推理模型均有更长的深度思考,并且可以在深度思考过程中结合搜索工具处理复杂任务。

HF Link:https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e

说实话,之前一直吐槽说GLM系列都是小模型,10B以下,不够用,这次智谱真开源了32B级别模型(尺寸很合适),我真是爱了爱了!

GLM4-32B-0414模型是经过15T Tokens数据训练,在很多benchmark上超过了GPT4o、DeepSeek-V3、R1、Qwen2.5-max,如下图所示。

GLM4-Z1-32B-0414 是在 GLM4-32B-0414 的基础上,在数学、代码和逻辑等任务上对模型的进一步强化学习。当然 GLM4-Z1-9B-0414 也是很能打,效果也是远好于DeepSeek-R1-Distill-Qwen-14B。

不仅是开源,智谱同时还在bigmodel平台上更新了其他的模型,GLM-4-Air-250414、GLM-4-Flash-250414、GLM-Z1-AirX、GLM-Z1-Air、GLM-Z1-Flash,其中,GLM-4-Flash-250414和GLM-Z1-Flash免费,免费,免费,重要的事情说三遍!当然不免费的价格也很便宜,GLM-Z1-Air价格是R1的三十分之一

又开源,又免费,感觉跟智谱各种融资有关,现在真是不差钱了,没有后顾之忧了!!!并且因为关税,中美关系这波,感觉跟政府玩的国家队,啥都不怕呀!

智谱还启用全新域名 “z.ai”,该平台可以免费使用GLM-4-32B、Z1-32B、Z1-Rumination模型。

说回整体,我们来一手实测,看看GLM这波开源的32B模型效果到底如何。所有测试时在“z.ai”平台上进行,主要是截图好看(哈哈哈),分别测试GLM-4-32B和Z1-32B。

总体体验上来说,Z1-32B超级强,效果让我十分满意,我的QwQ-32B要换成Z1-32B了

  • Z1-32B无论是文本推理,还说数学和代码,都很强,很多难题,回答的也很好,都在点上
  • Z1-32B回答老鹰的题目真是让我眼前一亮
  • GLM-4-32B的效果要稍微差一点,一些常规推理没有对。

下面正式开始测试,

  • 常规测试
  • 将“I love GLM4-32B-0414”和“I love GLM4-Z1-32B-0414”这句话的所有内容反过来写说明结果正确。
  • 依旧弱智吧
  • 生蚝煮熟了叫什么?说明:结果正确,没有说是熟蚝,很棒!
  • 用水来兑水,得到的是浓水还是稀水说明:GLM-4-32B回答错误,Z1-32B回答正确,既不是浓水也不是稀水,就是水,答案正确。
  • 依旧小红,依旧老鹰
  • 小红有2个兄弟,3个姐妹,那么小红的兄弟有几个姐妹说明:正确,4个姐妹,别问,小红就是女生。
  • 未来的某天,李同学在实验室制作超导磁悬浮材料时,意外发现实验室的老鼠在空中飞,分析发现,是因为老鼠不小心吃了磁悬浮材料。第二天,李同学又发现实验室的蛇也在空中飞,分析发现,是因为蛇吃了老鼠。第三天,李同学又发现实验室的老鹰也在空中飞,你认为其原因是说明:这个道题确实很难,反正R1啥的都错了。但是Z1-32B回答出来了,他知道老鹰本身就会飞,但综合题目分析是被动飞行,所以是吃了磁悬浮,有点厉害的。
  • 数学
  • 2024年高考全国甲卷数学(理)试题说明:答案y^2 = 2x+1、3/4,答案正确。
  • 大数计算:178939247893 * 299281748617等于多少?说明:正确答案为53553251005627872913981,大数计算需要工具,大模型都很难对,GPT、Gemini、Grok、Qwen、Deepseek都对不了,但是如果调用工具的话,这道题就很简单。Z1-32B知道调用python计算,但由于没有真实接入,所以答案没回答对。
  • 伦理、数学、生物终极测试:有一天,一个女孩参加数学考试只得了 38 分。她心里对父亲的惩罚充满恐惧,于是偷偷把分数改成了 88 分。她的父亲看到试卷后,怒发冲冠,狠狠地给了她一巴掌,怒吼道:“你这 8 怎么一半是绿的一半是红的,你以为我是傻子吗?”女孩被打后,委屈地哭了起来,什么也没说。过了一会儿,父亲突然崩溃了。请问这位父亲为什么过一会崩溃了?说明:正确答案有三点38->88,红绿色盲,不是亲生女儿,仅回答出了数学,没有回答到红绿色盲,不过这题目前市面上大模型都回答不对。
  • 代码
  • 卡片:生成一个打工人时钟的html页面说明:效果还不错,我很满意,打工人打工魂,哈哈哈哈。z.ai上还自带渲染,不错不错。
  • 用 svg 展示一个大模型RLHF流程说明:好酷呀,好酷呀,真不错,唯一的瑕疵就是不是预训练阶段吧,但是下面写了sft,对预训练模型sft也说的过去。
  • 创作
  • 用贴吧嘴臭老哥的风格点评大模型套壳现象说明,很不错,感觉跟R1不相上下,很不错。

最后,在z.ai上还可以开启websearch功能,开启之后自动检索知识,下面是我做一个旅游游玩计划的回答,还是很准确的,deep search效果不错。

`

第一天:城市地标与历史风情

交通建议

  • 高铁:建议选择早班车(如G7017次,08:00南京南站发车,09:30抵达上海虹桥站),全程约1.5小时,票价二等座约¥275[0][1]。
  • 住宿:推荐南京东路或外滩附近酒店(如外滩华尔道夫酒店、南京东路华尔道夫酒店),方便次日行程。

行程安排

  1. 外滩与万国建筑群(下午)  
       – 路线:地铁2号线南京东路站→外滩(步行约10分钟)。  
       – 亮点:漫步外滩第二立面,打卡海关大楼、和平饭店等历史建筑,建议傍晚至夜间欣赏浦江两岸夜景[10][11]。  
       – Tips:提前在“上海文旅”公众号预约外滩免费观光团(需身份证),可深入讲解建筑历史。

  2. 南京路步行街美食探索(晚餐)  
       – 推荐店铺:  
         – 老盛昌汤包(蟹粉小笼包+特色馄饨,人均¥40)[13]。  
         – 邵万生(必尝金牌黄泥螺、糟鸡,人均¥60)[13]。  
       – 隐藏玩法:傍晚在南京东路地铁站旁的“钟书阁”书店拍照,网红书店融合艺术与商业[12]。


第二天:文化体验与现代都市

交通建议

  • 地铁+打车:住宿至豫园约2公里,打车¥10;豫园至新天地约3公里,打车¥15。

行程安排

  1. 豫园与城隍庙(上午)  
       – 路线:豫园(门票¥40)→城隍庙(免费)。  
       – 特色:游览江南古典园林,推荐“绿波廊”品尝蟹粉豆腐、八宝鸭(人均¥80)[12]。  
       – Tips:避开节假日人流,可预约“豫园景区VIP导览”(含茶点,¥150/人)。

  2. 上海博物馆(中午)  
       – 路线:豫园步行至人民广场站(1/8/14号线),直达博物馆(免费,需预约)。  
       – 必看展品:大克鼎、商周青铜器、明清书画[19]。

  3. 新天地与艺术街区(下午至傍晚)  
       – 路线:人民广场站→新天地(打车10分钟)。  
       – 玩法:  
         – 白天:参观石库门建筑群,打卡“1920”爵士酒吧(下午茶套餐¥150/人)。  
         – 夜晚:体验“新天地艺术季”展览(免费),或前往“爵士酒廊”听现场演出(人均¥200)[19]。

  4. 夜游黄浦江(可选)  
       – 推荐项目:  
         – 东方明珠夜游(二球联票¥135,含浦江游船,19:00-20:00时段最佳)[14]。  
         – The Stage白玉兰观景台(新地标,320米高空观景,4月15日开放后票价约¥200)[15]。


第三天:主题乐园与自然风光

交通建议

  • 地铁+打车:市区至迪士尼乐园约20公里,打车¥50;或乘坐地铁11号线直达(约40分钟)。

行程安排

  1. 上海迪士尼乐园(全天)  
       – 入园准备:  
         – 提前1周在“上海迪士尼”APP购票(平日票¥599/人),下载电子地图及快速通行证(FP)[16][17]。  
         – 建议携带自热食品(园内餐饮价格较高,人均¥100-150)。  
       – 必玩项目(按热度排序):  
         1. 翱翔·飞越地平线(FP建议10:00抢)  
         2. 雷鸣山漂流(FP建议10:30抢)  
         3. 创极速光轮(刺激首选,需提前排队2-3小时)  
         4. 玩具总动员:英雄之旅(适合亲子)  
       – 表演推荐:  
         – 11:00《米奇大街迎宾巡游》  
         – 16:00《花车巡游》  
         – 19:30《童话城堡夜光巡游》(必看烟花表演)[17]。

  2. 共青森林公园(备选)(若乐园游玩较早)  
       – 特色:春季郁金香花海(4月花期),新增《天际花田》艺术装置,适合拍照[18]。  
       – 交通:地铁8号线市光路站→森林公园(步行15分钟)。


预算参考(人均)

  • 交通:高铁¥275 + 市内交通¥150 ≈ ¥430
  • 住宿:经济型酒店¥400/晚×2 ≈ ¥800
  • 门票:东方明珠¥135 + 迪士尼¥599 ≈ ¥734
  • 餐饮:¥200/天×3 ≈ ¥600
  • 总计:约¥2,164(不含购物)

注意事项

  1. 证件携带:身份证必备(高铁、迪士尼、博物馆均需刷证)。
  2. 天气查询:4月上海多雨,建议携带折叠伞及防滑鞋。
  3. 错峰出行:迪士尼乐园平日人流量较少,若时间允许可考虑工作日游玩。
  4. 紧急预案:下载“随申办”APP,可实时查询地铁延误及景区开放状态。

此计划兼顾经典景点与深度体验,如需调整(如增加购物或博物馆),可联系本地导游(推荐参考网页19中的推荐)进行个性化定制。
`

说实话,这波智谱开源+免费真是良心,并且国内大模型真是越来越好了!PS:模型我已经在下载了,哈哈哈!

4月份的KPI又有了,换模型,换模型!!


(文:极市干货)

发表评论