10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个

机器之心报道

编辑:杨文

这个AI让打工人「磕头」致谢。


前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩溃。要是哪个 AI 能一键分析表格,我当场就能给它磕一个。



现在,终于有 AI 来整顿 Excel 表格了!


这款 AI 工具名为 Shortcut,号称是「第一个超越人类的 Excel Agent」。它能够一次性完成大多数 Excel 知识工作任务,甚至在大约 10 分钟内就解决了 Excel 世界锦标赛的复杂案例,准确率超过 80%,这比人类快 10 倍。


(冷知识:Excel 世界锦标赛(MEWC)‌是由金融建模世界杯(FMWC)团队组织、微软官方支持的全球性电子竞技赛事,参赛者需通过 Excel 解决复杂场景化题目,2024 年决赛以《魔兽世界》为模拟场景,冠军奖金 5000 美元。)



Shortcut 具有与 Excel 近乎完美的功能兼容性,可以直接编辑、导入和导出文件,它不仅限于基础 Excel 操作,还能处理复杂的金融建模任务,例如:


  • 构建多标签的预估上限表( Pro Forma Cap Table)。

  • 分析 5000 行 CSV 数据,生成图表和仪表板,提供深入见解。

  • 递归解决错误,确保财务模型的准确性。


此外,它还有隐藏功能,比如画尤达大师。


据 fundamental 联合创始人 nico 演示,他只需输入提示词:帮我创作一幅精美的 50×50 像素的尤达图像,放在 B 列,通过阴影处理和色彩运用来展现它的标志性特征。Shortcut 就开始一步步执行任务,先设置像素网格,并将单元格调整为正方形,接着用各种绿色阴影创建尤达的耳朵和基本脸型。



当然,Shortcut 也有一些局限性,比如在格式化方面比较懒、在长时间多轮对话中表现不佳、处理大型 PDF 时可能遇到上下文限制。



Shortcut 目前处于早期预览阶段,大家可以在 X 上评论以获取邀请码。


  • 邀请码获取地址:https://x.com/nicochristie/status/1940440489972649989

  • Shortcut 地址:http://tryshortcut.ai


我们试了一下,只要使用谷歌邮箱登录,即使没有邀请码也能获得 3 次免费体验机会。


接下来,我们就奉上一手实测。


一手体验


Shortcut 界面分为两部分,左侧类似于 Excel 表格,右侧是聊天区,输入提示词就能指使它干活。


点击左上侧的「Open Xlsx File」就能上传原始的 excel 文件,当然也可以一键新建、保存文档。


比如,我们上传了 5 款大模型挑战语文高考卷的成绩单,先让它算出各个模型对应的总分,再根据以上表格分析一下每个模型在各个题型中的得分情况。



领到任务后,它就开始咔咔思考,并像其他 Agent 一样让我们提供更多信息,比如计算的总分输入到哪一栏、分析得分情况是使用哪种形式等。确认完上述信息后,它就开始制定计划。


以下红框圈出来的部分即是 Shortcut 生成的。我专门核对了一遍,它计算的各个模型总分和相对于满分的百分比全都准确无误。



并且能根据表格准确分析出五大模型在总分、各个题型中的表现情况。



不过,我们对照右侧的任务清单,发现它也漏掉了几项,例如条形图、比较总分的柱状图以及雷达图等,翻遍了各个角落也没找到相应的图表。



难度升级。我们又上传了那个曾把我们搞得焦头烂额的各科评分明细表,让它分析这 5 款大模型在语文学科中第 23 题中的最终得分分别是多少,并形成一个表格。


好家伙,Shortcut 直接罢工:由于早期访问期间需求量大,Shortcut 正在承受压力,我们正在扩大容量,请稍后再试。我们换了几台电脑重新试了几次,还是没有起色。



我们还让它生成一个像素版马里奥图像,输入的提示词:Create a beautiful 50×50 pixel art of Mario, placed in column B, showcasing his iconic features through shadowing and color usage.


Shortcut 还是先要求细化需求,比如要创建哪个版本的马里奥、马里奥的姿势和表情等。



确认完以上细节,它立马就能响应:



来看看经典 8-bit Mario 最终效果,虽然有点抽象,但起码完成了任务。



总体来说,对于一些简单的表格生成、数据处理(比如计算总和、百分比等),Shortcut 可以轻松搞定,但如果投喂给它的表格数据过于复杂,它就很容易「宕机」。


虽然传统 Excel 是一款功能强大的工具,但其复杂性和易出错的特性让打工人痛恨已久,这也就给 Shortcut 等专门处理 Excel 任务的 Agent 巨大的发展空间,不过就目前来看,它们似乎还有较长的路要走。


(文:机器之心)

发表评论