
刚刚抽空对今天发布的Qwen3 -235B进行了一个简单测试
我主要针对前端代码能力(简单提示,复杂提示),以及稍微具有复杂逻辑的普通人可以玩的小项目代码能力测试
就我目前的的测试来看,qwen3的前端复杂提示表现不太好,复杂项目的代码细节处理稍微欠缺
以下是测试结果:
前端
简单提示:卡片制作
比如以下三个简单提示,抽卡表现挺稳定的,基本上能生成精美的卡片
1.在strawberry中有多少个“r”?制作一张可爱的卡片

2.9.7和9.22那个大?制作一张可爱的卡片

3.Money is a database for exchange of goods & services. Money doesn’t have power in & of itself. The actual economy is goods & services”
一 Elon Musk
制作一张可爱的卡片

简单提示:创建单个html网页
提示1:
创建RAG的图形化工作流概述html
测试结果:
一次成功,这个网页并不复杂,有点像流程图,表现还好

上点强度,根据文档内容来创建html可视化文档(上传一个pdf文档,文档是关于今天qwen3发布博客官方blog)
提示2(from mengshao):
帮我将这个内容生成一个HTML网页,具体要求是:
使用 Bento Grid 风格的视觉设计,深色风格,强调标题和视觉突出,注意布局合理性和可视化图表、配图的合理性
测试结果:
可以渲染成功,这个提示词基本上把今天的发布blog进行了一个简单的可视化,遗憾的是模型性能比较部分出现了显示错乱,另外整个可视化太过于简略,开了思考模式,预算拉到最大,最终效果和不开思考模式表现相差不大


复杂提示:创建单个html网页
由于上面的简单提示对文档进行可视化变现不佳,我又尝试了一下复杂提示
任务还是对qwen3发布blog pdf文档进行可视化
提示词(from藏师傅):

测试结果:
很遗憾,我试了几次网页都没有渲染成功,开启思考模式还是不能渲染成功,所有就这个提示而言,qwen3的复杂提示遵循可能表现不是很好,相应的谷歌Gemini 2.5pro基本每次抽卡都可以成功渲染,而且变现惊艳

小项目代码能力
我让qwen3实现一个图片圆角处理的小程序,可以在colab里运行
具体提示:
帮我实现一个可以在google colab运行的图片圆角处理程序,要求可以处理任意主流图片格式,包括gif,可以一次上传要处理图片,处理完后,自动下载到桌面,我用的的mac电脑
测试结果:
开启qwen 3的思考模式,代码很快就写好了

把代码复制到colab里,点击运行,上传一张png图片和一张gif格式的图片,成功处理,圆角半径RADIUS = 50

但是打开经过处理的gif图片,发现gif显示有问题,png处理是完美的,这说明qwen3在一些逻辑稍微复杂工程中的会忽略一些细节,以下是处理前后对比(Gemini 2.5 pro对图片圆角处理的代码一次成功,处理效果也很完美)




以上就是qwen3-235B 的一个简单的测试,大家也可以带入自己工作学习的场景试试看
⭐
(文:AI寒武纪)