重磅!亚马逊云科技Nova模型家族横空出世,「选择」才是王道

在刚刚结束的2024亚马逊云科技re:Invent全球大会上,亚马逊云科技CEO Matt Garman携手「云计算教父」Andy Jassy重磅发布了Nova模型家族!

——为AI应用带来前所未有的选择自由。

这次发布的Nova模型家族,带来了四大核心模型

  • Micro:专注简单任务的超高性价比文字处理模型

  • Lite:低成本多模态模型

  • Pro:兼顾准确性、速度和成本的中坚力量

  • Premier:专攻复杂推理任务,支持蒸馏定

性能对比惊人:Nova模型在与OpenAI、Gemini和Claude的对标测试中展现出强劲实力。

Nova Lite在19项基准测试中有17项优于GPT-4o Mini,而Nova Pro在20个基准中的17个超越了GPT-4o

Nova Canvas:图像生成的新标杆

亚马逊云科技同步发布了Nova Canvas图像生成模型,不仅支持自然语言生成工作室级别图像,还提供色彩和布局方案控制。

在图像质量和指令跟随方面,Nova Canvas超越了DALL·E 3和Stable Diffusion 3.5 Large。

Nova Reel:视频生成的新纪元

Nova Reel视频生成模型让用户能够创建工作室级别的视频内容,提供完整的摄像机运动控制,包括平移、360度旋转和缩放。

首先是自然是文生视频,提供prompt 后Nova Reel 就能将想法变成栩栩如生的视频。

使用下面prompt 可以得到可爱小狗狗身披彩光灯的视频,无需抽卡:

Dynamic handheld shot: the dog looks to the left as colored holiday lights on its body blink rhythmically.

[译]动态手持镜头:狗狗朝左看,身上装饰的彩色节日灯光有节奏地闪烁。

另一个例子是,用下面的prompt 就能让Nova Reel 生成逼真的火苗效果。只是火花跳动的似乎比我想要的要有些慢,推测可以通过prompt 去调整(这个测试就交给你了~):

Static shot of a fireplace in nature; fire animation; 4k; Cinematic; at night; peaceful; highest quality; dolly in;

[译]静态镜头:自然中的壁炉;火焰动画;4K;电影感;夜晚;宁静;最高画质;推镜头。

此外,Nova Reel 支持图+Prompt 的方式。用下面的原图:

并结合”Dolly forward.” 的prompt 后,就能得到“将镜头推进”的动起来了的视频。画面平稳丝滑,细节符合物理逻辑,完全找不出AI 痕迹:

目前支持6秒视频生成,并很快将推出两分钟视频功能的新版本。

以亚马逊科技的过硬实力,相信不会像Sora 那样一,值得期待!

未来展望:语音到语音与多模态输入输出

亚马逊云科技的野心不止于此。

2025年一季度,他们将推出语音到语音模型2025年年中,将发布支持文本、语音、图像及视频的多模态输入输出模型

技术支撑:算力与推理的双重突破

为支持Nova模型家族的强大性能,亚马逊云科技推出了基于英伟达Blackwell芯片的P6系列实例,性能比当前GPU快2.5倍。

同时发布的Trn2实例集成16个Trainium2芯片,性价比高出30%至40%。

更令人期待的是,2025年即将推出的Trainium3芯片,基于3纳米工艺制造,性能是Trainium2的两倍,能效提升40%。

存储与数据库的创新升级

为支持大规模AI应用,亚马逊云科技发布了Amazon S3 TablesS3 Metadata服务,专为Iceberg设计的存储类别可提供3倍查询性能。

同时推出的Aurora DSQLDynamoDB global tables,为全球化部署提供了强大支持。

Amazon Q:AI助手的新标准

全新发布的Amazon Q Developer带来三个专业Agent,用于生成单元测试、文档和代码审查,并与GitLab深度集成。

Q Business则通过连接不同业务系统,实现企业数据的智能搜索与对话。

Nova模型家族的发布,不仅展现了亚马逊云科技在AI领域的技术实力,更重要的是为企业和开发者提供了前所未有的选择空间。

各种尺寸、各个模态、各类方案,应有尽有,均能满足你的偏好!

如Andy Jassy 在演讲中所说:「选择决定一切」。

如何体验?

为帮助开发者和企业快速掌握这些前沿技术,亚马逊云科技特别准备了两场重磅实践工坊,带您零距离接触Nova模型家族与Amazon Q的强大能力。

工坊一:客户之声解决方案实战

用Amazon Bedrock与Nova大模型打造智能客户之声系统,从多模态体验到RAG技术应用,可以全方位提升客户服务能力。

工坊二:Amazon Q Developer极简开发工坊

踏入生成式AI驱动的智能开发新时代,体验代码智能生成、审核优化、自动化测试等革命性功能,重新定义新的AI native 开发流程。

给自己多一些选择,因为,选择决定一切!


* 前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。

(文:AGI Hunt)

欢迎分享

发表评论