速递|前OpenAI团队操刀,Nova Act浏览器AI助手,测试得分超竞品OpenAI

图片来源:Nova Act

亚马逊在周一发布了 Nova Act,这是一种通用的人工智能AI Agent,可以控制网页浏览器并独立执行一些简单的操作。

Nova Act 是亚马逊试图与 OpenAI 的 Operator 和 Anthropic 的 Computer Use 竞争的一种通用人工智能AI Agent技术。几家领先的科技公司认为,能够为用户浏览网络的 AI Agent将使今天的 AI 聊天机器人变得更加实用。

与新的 AI Agent人工智能模型一起,亚马逊还发布了 Nova Act SDK,这是一个工具包,允许开发者使用 Nova Act 构建AI Agent原型。

Nova Act 由亚马逊最近开设的位于旧金山的 AGI 实验室开发,还将为公司即将推出的 Alexa+升级提供关键功能,这是亚马逊流行语音助手的生成式人工智能增强版本。

然而,从今天开始提供的 Nova Act 版本稍显粗糙,亚马逊称之为研究预览版。开发者可以在新网站 nova.amazon.com 上访问 Nova Act 工具包,该网站还展示了亚马逊的各种 Nova 基础模型。

亚马逊可能不是第一个开发这种AI Agent技术的公司,但通过 Alexa+,它可能拥有最广泛的覆盖面。

亚马逊表示,使用 Nova Act SDK 的开发者应该能够代表用户自动执行基本操作,例如从 Sweetgreen 订购沙拉或进行晚餐预订。借助 Nova Act 工具包,开发者可以整合工具,使 AI Agent能够浏览网页、填写表单或选择日历上的日期。

亚马逊声称,Nova Act 在公司的多项内部测试中,表现优于 OpenAI 和 Anthropic 。

例如,在 ScreenSpot Web Text 上,该测试衡量 AI Agent如何与屏幕上的文本互动,Nova Act 得分 94%,超越了 OpenAI 的 CUA(得分 88%)和 Anthropic 的 Claude 3.7 Sonnet(得分 90%)。

然而,亚马逊并没有使用更常见的AI Agent评估方法对 Nova Act 进行基准测试,例如 WebVoyager

Nova Act 是亚马逊上述 AGI 实验室推出的第一个公共产品,该实验室由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导。

两人之前各自创办了自己的初创公司——Luan 创办了 Adept,而 Abbeel 则共同创办了 Covariant——在亚马逊去年将他们挖走,负责其 AI Agent工作之前。

尽管一个 AGI 实验室开发能够点沙拉的 AI Agent听起来很奇怪,Luan 在接受 TechCrunch 采访时表示,他认为AI Agent是创建超智能 AI 系统的关键一步。Luan 将 AGI 定义为“一个可以帮助你在计算机上完成任何人类所做事情的 AI 系统。”

Luan 表示,他的团队设计了 Nova Act SDK,以可靠地自动化短小简单的任务,并为开发者提供工具,以精确定义他们希望在AI Agent工作流程中何时需要人类干预。他希望这能让开发者创建更可靠的AI Agent应用程序,尽管不一定是完全自主的。

亚马逊在竞争激烈的市场中发布其首个通用 AI Agent,但这是一项公司寄予厚望的关键技术。Nova Act 的早期测试可能会让人们一窥长期延迟的 Alexa+的一些能力,这对亚马逊的 AI 努力来说是一个生死攸关的时刻。

OpenAI、谷歌和 Anthropic 早期 AI Agent的一个主要问题是它们在不同领域的可靠性。在 TechCrunch 的测试中,这些系统反应缓慢,难以长时间独立操作,并且容易犯人类不会犯的错误。我们很快就会看到亚马逊是否破解了这个难题——或者它的AI Agent是否也遭受着竞争对手同样的缺陷。


资料来源:

https://techcrunch.com/2025/03/31/amazon-unveils-nova-act-an-ai-agent-that-uses-a-web-browser/

编译:ChatGPT


——-

(文:Z Potentials)

欢迎分享

发表评论