🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
AI 编码这赛道,卷得是真上头。
现在又来了个新选手,Vercel 的 V0 ——
这个你可能一直在用的、能搞出高质量 Web 应用 UI 的工具,现在直接发布了自己的 AI 模型。
而且,你可以在 Cursor 里直接用它。

他们还搞了些新的 AI 编码工作流,让 UI 生成效果更上一层楼。
具体这模型咋回事,官方没细说。是定制的 GPT 呢,还是从零开始训的?不好说。
但能确定的是,Vercel 手里有的是数据:海量的代码输入输出、扒不完的源码,更重要的是,用户点的那些赞、踩、重试的反馈。
看样子,他们就是用这些数据,把一个模型给调教出来了,让 V0 的 UI 生成能力尽可能地强。
结果就是,V0 生成的 UI,一直是我用过的 AI 平台里最好看的之一。
Vercel 的目标是啥?
他们说得很清楚:专为构建现代 Web 应用设计。支持文本和图像输入,流式响应速度快,兼容 OpenAI 的聊天补全 API 格式。
几个亮点:
-
框架感知补全 (Framework aware completions): 这点很重要,模型是用 Next.js、Vercel 这些框架的数据训练的。至于其他框架比如 Svelte 表现怎么样,就不知道了。
-
自动修复 (Autofix): 能在生成过程中识别和修复常见的编码问题,挺酷。
-
快速编辑 (Quick edit): 能流式传输行内编辑,而不是整个文件重新传。如果你用那种能实时编辑代码、发送 diff 的画布体验,这功能就很有用。
-
多模态 (multimodal): 虽然说了多模态,但我试了下,它自己说不能直接生成图片。
下面是我在 Cursor 里用上 V0 模型的设置方法。
想在 Cursor 里用上 V0 模型,得先折腾一下。因为 Cursor 现在还没原生支持 V0 模型。
设置步骤:
-
打开 Cursor 设置里的 Models。
-
找到 OpenAI Base URL 那一项,填上 api.v0.dev/v1,保存。
3. 然后去 V0 的聊天界面,进设置,生成一个 API Key。
https://v0.dev/chat/settings/keys
4. 把这个 Key 粘贴到 Cursor 里,点验证。

搞定之后,以后你在 Cursor 里选 OpenAI系列的模型,背后实际上调用的就是 V0 的模型了。

官方模型标识符以 -MD 结尾,代表 medium,但用的是 Tailwind 的字符串约定,这又强调了他们关注的是 Tailwind 和良好的全栈 React 开发者体验。
并且我们可以看到api的模型版本是1.0,网页端是1.5。API模型正在Beta开测。
简单演示一下效果。
用 Claude 3.7 模型,让它“做一个GIF拼接应用”,
提示词:
Develop a GIF dynamic collage generator that enables users to create comparison GIF collages without video editing expertise. This tool should meet social media needs, allowing multiple GIFs to be displayed side by side to illustrate different states or comparisons.
1. Dynamic Canvas Construction
- Create a virtual canvas as a container for the collage.
- Allow users to arrange multiple independent GIFs within the canvas, similar to puzzle pieces.
- Support basic layouts, including:
- 2×2 grid (4 GIFs)
- N grid (variable number of GIFs)
- Horizontal bars (1×n)
- Vertical columns (n×1)
2. User Interaction
- Upload or drag and drop multiple GIF files.
- Provide an intuitive interface to arrange GIFs within a selected layout.
- Options to adjust the size and position of each GIF in the collage.
- Allow preview before exporting.
3. Output
- Generate a single output file containing all arranged GIFs.
- Preserve individual GIF dimensions and animations.
- Maintain the selected grid layout in the final output.
- Ensure all GIFs start playing simultaneously.
Ideal Interaction Flow:
```mermaid
sequenceDiagram
participant User
participant System
User->>System: Upload or drag and drop n GIF files
activate System
System->>User: Display layout options and allow GIF arrangement
User->>System: Select layout and arrange GIFs
User->>System: Export final GIF
deactivate System
出来的结果大概是这样:
过于简单。功能差点意思。
现在,咱们换成 GPT-4 模型 (记得打开 OpenAI API Key 开关,这样实际用的是 V0),同样的提示V0:。
效果:
完成度较高。
当然这个小应用两个模型都不是一轮能无Bug解决的,但是我们仅仅看同一轮提示他们的差异。V0这些Web工具同样的提示往往能考虑的更多,做得更加系统、工整。
但是像V0、Bolt这些工具,你在提示的时候也尽量循序渐进。把大的问题拆开。提示词描绘的需求尽量是那种可以在同一轮中解决的。
那些过于宽泛过于完整应用的提示需求一轮下来常常会导致报错。
不过你其实不用整个开发过程都吊死在 V0 模型上。
可以先用它打个样,定下应用大概长啥样,然后换成更强的模型,比如 Claude 3.7 或者 Claude 4,在这个基础上继续加功能。
注意,使用Claude 的时候, OpenAI API Key 开关要关掉 。
此外,Cline中的配置。
所以。。
Vercel 为啥要费劲搞自己的模型?
可能的原因不少。
最明显的一点,就是输出质量。
还有一点是输出的相关性。那些通用大模型,是在海量数据上训练出来的,啥都会一点,但可能没啥“品味”,因为它们的目标是尽可能多,而不是尽可能好。
最近,大家都在努力筛选训练数据,给模型加更多上下文。像 DeepSeek R1,很可能就是用其他模型的输出来训练的,为了让效果更好。
当训练数据越来越少,而我们又想要更高质量、更能代表我们期望模型做的事情的数据时,精心筛选过的数据就越来越值钱了。
Vercel 想要更精细的数据,合情合理。
一个重要原因是,支持 Vercel 自己想搞的新东西。
一部分动机可能是因为 Vercel 现在搞的那些酷玩意儿,比如服务器组件、用 SSE搞 HTTP 流、AI SDK 这些,太新太怪了,AI 模型还不太会用。
你可以在系统提示里加一堆东西,在 Cursor 里加一堆规则,但用过非原生 React 和 TypeScript 框架的人都知道,那有多痛苦,模型会随机在你代码里瞎编 React 语法。
Vercel 在这方面还算幸运,因为 Tailwind、React、TypeScript、Next.js 这些够主流,模型表现还行。但对新东西,尤其是一些特殊功能,模型就不太行了。
所以,如果 Vercel 能用规则引导模型,再用上自己生成的数据和 V0 用户的数据来训练,就能搞出更精炼的模型。
这可能就是他们最想要的。
他们不想完全依赖 Anthropic。
如果你用 Cursor,又想要 V0 那种输出质量,现在就能实现了。
把 V0 模型用到 Cursor 里的想法,其实挺吸引人的。这也帮他们对冲了一个巨大的赌注,那就是:不会有哪个氛围编码工具能一家独大。
V0 再牛,也不太可能成为唯一的选择。如果像 Bolt 这样的工具流行起来,支持多种框架,那 Vercel 长期成功的可能性就降低了。
但如果他们有一个非常擅长全栈工作、能持续生成漂亮网站的模型,那大家就可以开始依赖这个模型,而不用非得用 V0 这个产品来享受 Vercel 的成果了。
你可以把这看成一个谱系,公司怎么让 AI 生成的输出更好?
第一步是模型。很难做出比模型本身能生成的更好的东西。
然后是系统提示 (System Prompt)。这玩意儿基本上是告诉模型它能干啥。
再然后是工具 (Tools)。模型被告知它能用哪些工具。你在 Cursor 里让它跨文件修改,看到它运行 GPT 去找要改的文件,那就是 Cursor 提供给 Claude 用的工具调用。
工具调用很快就成了 AI 做酷炫事情的基石。系统提示必须描述有哪些工具、怎么用、返回格式是啥。
最后是用户提示 (User Prompt)。
工具这块儿有很大的潜力。以前像 V0、Cursor 这些工具,主要精力都在工具调用上。Claude 3.5 的一大胜利就是工具调用做得好。
现在,模型公司比如 OpenAI、Anthropic,也都在改进工具和工具调用。Cursor 也是个资金雄厚的公司,专门搞工具调用,打造最好的编辑器体验。
而系统提示这块儿,越来越不值钱了。
所以,如果把这看成一个滑动的谱系,用户提示我们控制不了,工具调用竞争激烈,系统提示又商品化了,那还剩下啥?
就是模型本身。
Vercel可能 就是这么想的。他们从“怎么写最好的提示词”到“需要什么工具”到“怎么通过系统提示优化输出”,现在终于到了“模型”这一步。
他们有大量关于什么能让模型生成效果更好的数据。
AI 绘画元方法:不肝提示词,文章直出封面。(端到端篇)
AI 绘画“元方法”分享,免费绘图流,掌握思维比提示词更重要。(融图篇)
本号知识星球(汇集ALL订阅频道合集和其他):
星球里可获取更多AI实践和资讯:
MCP文章,从概念到实践再到自己构建:
MCP是什么:Windsurf Wave3:MCP协议让AI直接读取控制台错误,自动化网页调试不用复制粘贴了!Tab智能跳转、Turbo模式。
MCP怎么配置、报错解决:Windows下MCP报错的救星来了,1分钟教你完美解决Cursor配置问题。
MCP实践:Cursor + MCP:效率狂飙!一键克隆网站、自动调试错误,社区:每个人都在谈论MCP!
最新MCP托管平台:让Cursor秒变数据库专家,一键对接Github,开发效率暴增!
Blender + MCP 从入门到实践:安装、配置、插件、渲染与快捷键一文搞定!
比Playwright更高效!BrowserTools MCP 让Cursor直接控制当前浏览器,AI调试+SEO审计效率狂飙!
手把手教你配置BrowserTools MCP,Windows 和 Mac全流程,关键命令别忽略。
2分钟构建自己的MCP服务器,从算数到 Firecrawl MCP(手动挡 + AI档)
太简单了!Cline官方定义MCP开发流程,聊天式开发,让MCP搭建不再复杂。
🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。
参考链接:
[1] https://x.com/v0/status/1925375968077914268
[2] https://www.youtube.com/watch?v=VEByHg_aFPI
[3] https://x.com/v0/status/1925375968077914268
[4] https://x.com/ragingwind/status/1925483599023022509
点这里👇关注我,记得标星哦~
(文:AI进修生)