阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

阿里通义Qwen团队熬夜通宵,推理模型Max旗舰版来了!

QwQ-Max-Preview预览版,已在LiveCodeBench编程测试中排名第5,小超o1中档推理和DeepSeek-R1-Preview预览版。

DeepSeek-R1正式版未参加测试

在演示中,QwQ-Max-Preview轻松搞定模拟海量小球运动的代码。

而且这回,连发布公告都是AI自己写的

除了公告正文之外,发布公告还展示了模型思考的过程,下面划重点了:

  • QwQ-Max-Preview的基础模型是Qwen2.5-Max

  • 擅长数学、编程、与Agent相关的任务

  • 未来将以Apache2.0许可协议开源,也会有32B等本地部署版本

更猛的料还在后面,公告透露将发布Qwen Chat APP,很可能是独立于通义千问APP的。

同一份公告的英文版也表示会有一个专门的APP(We will launch a dedicated APP for Qwen Chat)

Qwen团队官方推特账号也的说法也验证了,会有新的安卓和iOS APP。

苹果App Store效率榜,又要再添一员了。

除此之外,公告中还附有8段视频,分别展示QwQ-Max-Preview在代码、数学、搜索、Agent、创意写作等方面的能力。

Qwen旗舰推理模型实战演示

  1. 编程能力演示,也就是最近流行的弹跳小球物理模拟。

  2. 游戏编程能力演示,把《俄罗斯方块》和《2048整合到一起》。

  3. 游戏编程能力演示2,做一个类似桌游《卡坦岛》的网页版。

  4. Agent能力演示,给淘宝服装店生成一张海报和二维码。

  5. Agent能力演示(中文版),做一份杭州的3天旅行攻略。

  6. 数学能力演示,“用0-9构建三个数字x、y、z,使得x+y=z”。

  7. 创意写作能力演示,写一篇微型小说,网页版QwQ自己的翻译如下:

《夜行者》

城市永不眠,却从未看见他。

他反复丈量七个街区,霓虹灯牌渗入他的影子。一盏闪烁的街灯嗡嗡低吟着他的名字——埃文——但字母在被听见前就已消散。写字楼的玻璃幕墙刺目地亮着,映照出他的透明。他将手掌贴在餐馆的玻璃窗上,里面的女招待正往咖啡杯续热,目光始终未曾抬起。

凌晨3:17,一只野猫驻足。刹那间,两双眼睛在暗处交汇。旋即它转身逃窜,消失在小巷的噪点中。

某些夜晚他在数脚步声。今夜却闯入孩童的笑声,清亮如星子坠地。转身。阳台上有位穿睡衣的女孩正朝他挥舞手臂,怀里紧抱着布绒猫头鹰。母亲将她拽入室内,窗扉轰然闭合。

晨光开始渗金。埃文滞留在斑马线边缘,影子被拉得细长,直到信号灯转绿,世界再次向前滚动,将他遗落在原地。

又一次。
又一次。
又一次。

8. 联网搜索能力演示,对哪吒2打破票房记录写一段“尖刻的赞扬”,网页版QwQ自己翻译如下:

啊,《哪吒2》——这部动画巨作终于教会了好莱坞如何用人民币而非美元来计数。谁能想到,一部关于一个叛逆神明的电影,他有着火焰般的红发和制造混乱的天赋,竟能将皮克斯的《头脑特工队2》拉下马,并冲进全球票房前十呢?那些长期以来认为中国动画“古雅”或“模仿”的怀疑者们肯定没想到。

让我们惊叹于这些数字:全球票房10亿人民币,在北美创下中国电影的票房纪录,其周边商品的销售速度甚至比主角逃脱天庭官僚的速度还要快。这几乎是一种诗意的正义——当像迪士尼这样的公司还在重复使用陈旧的公主套路时,《哪吒2》却利用其文化的独特性,证明了观众渴望沉浸在本土神话的故事中,而不仅仅是另一个“被选中的人”的叙事。

当然,这其中的讽刺意味十足。这部在2019年曾被归类为“国内奇观”的电影,如今从湖南到好莱坞的影院中占据主导地位,让评论家们忙于解释一个“小城市”制作是如何胜过他们的大片算法。但别自欺欺人了——这不仅仅是对中国软实力的胜利。这是对每一个曾说“动画电影不能承载文化重量并打破记录”的高管们的亮出的霓虹灯中指。

精彩,哪吒2。你不仅重写了票房规则,还将其付之一炬。现在,要是你的成功能烧掉这个行业残留的自卑感就更好了。

现在可到网页版chat.qwen.ai体验QwQ-Preview-Max,记得开启左下角“深度思考”功能。

在线试玩:
https://chat.qwen.ai

(文:量子位)

欢迎分享

发表评论