前几天受邀参加了天工超级智能体(Skywork Super Agents)的提前测试。
试了一下我发现,相较于各种大包大揽的所谓通用智能体,天工非常的务实,专注于帮助打工人优化我们每天接触最多也是最繁琐的三个交付物,也就是所谓的 Office 三件套,文档、表格、PPT。
天工超级智能体不是简单的生成一个交付物就结束了,而是考虑到了整个内容的生命周期,从意图判断到内容检索到高品质生成到编辑和修改都做了非常多的优化,最大限度的保证内容的可用性。
先介绍一下天工超级智能体的主要能力:
- 五模态一键生成:一条指令即可创建文档、PPT、表格图表、网页和播客,还有独家Excel生成功能。
- 深度研究超级引擎:超强deep research服务,搜索能力超竞品10倍,GAIA评测榜首。
- 溯源透明赢得信任:每份内容都带精确溯源标记,让你在专业场合自信展示。
- 灵活编辑无缝导出:所有内容支持在线实时编辑,一键导出本地文件或直接上传至Google云端办公。
- 私人知识库定制:构建专属知识库基础上生成准确内容,彻底消除AI幻觉。

网页生成
我发现他们有网页生成模式,那是时候掏出藏师傅的老测试项目了。
今晚不是有小米发布会吗,我想了一个很好的测试方式,直接让他给小米做一个发布会预热网页。
这个除了考验对藏师傅网页生成提示词的还原以外,也非常考验对于最新信息的检索能力,因为很多都是预测信息,而且都是最近几天发布的,我们很容易就能看到检索的质量。
我也根据小米的设计风格改了一下网页生成提示词,大家有类似场景可以直接用。
这里可以看案例回放:https://www.skywork.ai/share/project/1925427538100752384?dataType=project&outputType=sheets&projectId=1925427538100752384&sharingId=1925448729532305408
帮我检索 20250522 日小米发布会的所有信息做成网页网页,不要遗漏信息 根据上面内容生成一个 HTML 动态网页
- 使用Bento Grid风格的视觉设计,纯黑色底配合#2657FD颜色作为高亮,标题和文字为白色和灰色
- 强调超大字体或数字突出核心要点,画面中有超大视觉元素强调重点,与小元素的比例形成反差
- 中英文混用,中文大字体粗体,英文小字作为点缀
- 简洁的勾线图形化作为数据可视化或者配图元素
- 运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变
- 模仿 apple 官网的动效,向下滚动鼠标配合动效
- 数据可以引用在线的图表组件,样式需要跟主题一致
- 使用 Framer Motion (通过CDN引入)
- 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript
- 使用专业图标库如Font Awesome或Material Icons(通过CDN引入)
- 避免使用emoji作为主要图标
- 不要省略内容要点
来看一下生成结果,是不是有那个味了兄弟们,他居然还画了个矢量的芯片目标,就看前面这几下,已经比很多专门做的的预热网页要好了。
信息也都没啥问题,基本上主要发布的内容都已经展示了,三个重点内容还各自站了一页,后面的零碎内容都放了上去信息非常丰富,详略得当。
通用模式和播客模式
我们先来看一下最不重要的两个部分,通用模式和播客模式,但其实他们也做的很好。
播客模式非常好理解,支持根据主题生成对应的对谈播客,不过只支持英文内容,这里我让他生成关于中美关税冲突的介绍播客。
针对中美关税风波生成一篇详细的逻辑清晰的对谈播客
可以看到播客生成的时长到了 13 分钟,两者的声音也很真实自然,基本从内容信息量和音频质量都不输 NotebookLM了,整个内容的编排很全面,而且不止是介绍信息还有很多的分析内容。
甚至还展示了对应的字幕这个比NotebookLM的体验好多了,错过的话还能看字幕了解。

至于通用模式,我发现他可以生成视频,哈哈。
这里我让他生成了最近在小红书很火的拟人化小猫咪参加各种战斗的视频,没想到他可以理解我的提示词,完美的还原了那个画风,还整上了配乐,太可爱了。
这种质量的视频只要发了就能爆,我本来对这个视频生成不抱太大期望的,结果效果还挺好,真厉害。
帮我创作一个非常可爱的猫咪拟人冒险 Vlog 视频,整个画面用极其平庸的手机拍摄,略带模糊,讲述了猫咪从刚入伍然后不断学习训练进步到参与各个兵种作战(步兵、海军、开战斗机),最后结束战争的故事,需要有故事性,场景变化要连贯
文档生成
然后我们来到重头戏,打工人三件套的文档生成,在文档生成上,他们也考虑的很细,做了很多的预设。
你可以选择各种你需要的文体,我们不能完全指望 AI,毕竟你用 AI 写过文章就知道,你需要将一些要求告诉他他才能写好,不然可能会出一个偷懒的东西出来。

我最近在研究 AI 编程嘛,于是就让他帮我生成一个 AI 编程产品的研究报告。
帮我生成一份现在所有主流AI编程产品的深度研究报告,搜索信息的时候用英文,PPT生成的时候用中文,今天是 2025 年 5 月 19 号
他在刚开始生成的时候如果你的要求给的不够细的话,他会生成一个可交互的卡片询问你的详细意图,你只需要选择就行,不需要打字,既提升了生成结果的可用性又降低了用户的操作成本,非常合理。
而且他只会在任务开始的时候询问,避免了你后面高高兴兴来看答案发现,还有个选项需要选,他没有进行任务这种尴尬情况。

然后他会执行自己设定的 Todo 列表,这里可以看到他记得我的要求,再用英文搜索相关内容,这样可以确保在一些领域避免国内的信息污染,各位用的时候也可以这样要求。

他们的结果居然是写的网页约束了样式,而且还能导出 Doc 格式,这个操作太秀了。
文档结果里面直接标注了数据和信息的来源网页,你和阅读内容的人都可以直接核实,不需要担心来源或者幻觉问题。
另外在每个数据多的东西他都会选择合适的图表展示数据,在每个部分结束的时候还有高亮的总结,都是小技巧啊朋友们,从这些地方就能看到是会写文档的。



PPT 模式
接下来我们来到老大难的 PPT 生成,这里他依然预设了很多常见的 PPT 制作需求,这样可以确保整体的规划和样式都符合对应的行业。

之后信息检索和意图选择都跟文档一样,看到结果的时候我惊了,他们居然使用前端实现的,这样保证了页面内容的丰富度,也保证了模板的丰富度,藏师傅之前的提示词启蒙还是有用的,各家的网页生成都玩的越来越溜了。
而且整个搜索出来的内容质量和数据质量非常高,整个编排也很有条理性,我自己搞反正想不了这么细,信息密度这么高的 PPT 居然生成了 26 页。




最强的是,他们搞定了 Html 转 PPT,虽然生成用的网页,但是导出的 PPT 格式文档一点问题都没有,跟网页完全一样,而且你也可以导出 PDF。
另外他们也考虑到了修改的情况,如果某一个数据或者表述不符合你的要求,你可以点击右上角的编辑对 PPT 进行实时编辑,文档能编辑可以理解,PPT 也可以编辑,那是真的很棒了。


表格模式
这个就是独一份的能力了,他可以生成真的 Xlsx 格式的表格,基本上其他类似 Agents 都没看到这个能力。
比如这里我让他调研美国估值前 50 的 AI 创业公司。
帮我列出截止目前(2025 年 5 月 19 日)美国现在估值前五十的AI公司的详细信息
从结果里面可以看到我都没说应该包含哪些数据,他自己发挥的相当好,名称、估值金额、创始人、主营业务、最新的融资轮次和金额都有了。
另外他还主动对数据进行了分析,比如公司类型占比以及融资轮次占比等,还有图表,你可以拿来直接用。


这次测试基本就到这里了,我们最近被各种所谓的 Agents 疯狂轰炸,很多人肯定跟我一样都有点 Agent 疲劳了。
我们厌倦了过度宣传和各种第一,天工超级智能体罕见的强调了自己专注的领域,虽然他们也能生成播客、视频,而且生成的很好。
但是他们知道这个不重要,专注于对用户提升最大的部分,在 Office 上下了巨大的功夫,从意图选择到网页转文档 PPT 到内容编辑,这些都是对需求有深刻洞察的产品才能做出来的功能。
在现在这个时间点,我们需要的不是各种通用和第一,模型也做不到,我们需要的是靠谱、稳定,可复现。
如果你觉的内容对你有帮助的话可以帮我点个赞👍或者喜欢🩷,也可以推荐给你需要的朋友们!
(文:归藏的AI工具箱)