独家视角:亚马逊云科技 re:Invent 2024 揭示AI模型选择的重要性

 

2024年底12月整月感觉都是一个属于AI 科技月,OpenAI 12天发布会惊喜不断,谷歌频放大招,作为云计算巨头亚马逊云科技也带来了2024 re:Invent全球大会,聚焦的都是AI技术和应用,但在这场盛大的科技月活动中,各家带给我们思考不尽相同,身处这个AI指数级爆发的时刻,不管是作为普通人还是大小企业,我们只需要往前一小步,看看巨头的思考和探索,也许就能打开另一个世界的大门

这次 re:Invent 大会,亚马逊云科技不光是“秀肌肉”,更重要的是,给我们带来了关于模型应用的“独家视角”,就像在“开课”,教我们怎么玩转 AI

正如亚马逊CEO Andy Jassy演讲时所说的,选择决定一切!需要用模型的时候最关键的是,有很多可选的自由!(CHOICE MATTERS,WHEN IT COMES TO MODELS SELECTION)

在今年的 re:Invent 2024 大会发布的内容里,你会看到,亚马逊云科技就像一个“超级装备店”,把各种技术都摆在了货架上,任你挑选。它不是“一锤子买卖”,而是想让你根据自己的需求和场景,像“玩游戏”一样,自由地搭配各种技术,打造属于自己的“专属神装”。你可以根据自己的喜好,选择不同的算力、不同的模型、不同的数据管理方式,让你的云端应用,真正实现“千人千面”

更重要的是,亚马逊云科技不仅提供了灵活丰富的选择,更致力于构建一个开放、多元的社区。这个社区,就像一个“百花齐放”的花园,各种技术、各种模型,都在这里蓬勃生长。你可以自由地探索这个花园,发现新的惊喜,找到最适合自己的“那朵花”。在这里,你可以和别人合作,可以和别人交流,可以共同创造新的价值

计算基石:多样化选择驱动性能与效率的提升

在云计算领域,计算资源是所有应用的基础。亚马逊云科技在 re:Invent 2024 大会上,推出了新一代数据中心组件和基于自研芯片的 Amazon EC2 实例,这些创新不仅提升了计算性能,更强调了选择的重要性。客户的需求是多样化的,没有一种单一的计算方案能够满足所有需求,因此必须提供多种选择,让客户能够根据自身工作负载灵活搭配

新一代数据中心组件:模块化设计与可持续发展

亚马逊云科技新一代数据中心组件的推出,不仅是对现有基础设施的升级,更是一次对数据中心设计理念的革新。这些组件采用了更加简化的电气和机械设计,大大提升了系统的可靠性和可维护性。通过优化电力分配和冷却系统,亚马逊云科技不仅降低了能源消耗,还提高了计算资源的可用性。更重要的是,这些组件采用了模块化设计,使得现有的数据中心也能进行升级改造,从而快速部署最新的技术,并满足不断增长的计算需求。

具体而言,亚马逊云科技通过以下方式实现了数据中心组件的创新:

  • • 简化的电力分配系统: 减少了潜在的故障点,提高了电力供应的稳定性

  • • 高效的冷却系统: 包括液冷技术在内,能够更有效地应对高密度计算芯片的散热需求

  • • 自然压差排热: 减少了排热风扇的使用,从而提高了服务器的可用电力

  • • 模块化设计: 使得现有数据中心也能进行升级,从而快速部署最新的技术

这些创新不仅提高了数据中心的性能和可靠性,还兼顾了可持续发展。亚马逊云科技积极采用低碳材料和可再生能源,致力于降低数据中心的碳足迹,并帮助客户减少其环境影响

Amazon EC2 Trn2 实例和 Trainium3 芯片:AI 加速的自主研发

为了满足日益增长的 AI 计算需求,亚马逊云科技推出了基于自研芯片的 Amazon EC2 Trn2 实例和新一代 Trainium3 芯片。这些创新不仅体现了亚马逊云科技在 AI 加速领域的自主研发能力,也为客户提供了更多的选择

  • • Amazon EC2 Trn2 实例: 配备 16 个 Trainium2 芯片,通过 NeuronLink 高速互连技术,能够提供高达 20.8 Petaflops 的浮点算力。与基于 GPU 的实例相比,Trn2 实例提供了更高的性价比,使其成为训练和部署大型语言模型(LLMs)的理想选择

  • • Amazon EC2 Trn2 UltraServers: 通过 NeuronLink 超速互连技术,将四个 Trn2 服务器连接成一个大型服务器,提供高达 83.2 Petaflops 的浮点算力,满足超大规模模型的训练和部署需求

  • • Amazon Trainium3 芯片: 采用 3 纳米工艺制造,性能预计将是 Trn2 芯片的 4 倍,为客户提供更高的计算密度和能效,进一步拓展了 AI 应用的边界

这些芯片和计算实例的推出,不仅提供了强大的计算能力,更提供了多种选择。客户可以根据自身模型的规模、复杂度和预算,灵活选择最适合的 EC2 实例和芯片,从而实现最佳的性能和成本效益。例如,对于需要训练和部署大型语言模型的客户,可以选择 Trn2 实例或 Trn2 UltraServers;而对于需要更高性能和效率的客户,则可以期待 Trainium3 芯片的到来

AI 模型选择:生态繁荣,百花齐放,自研模型

在人工智能领域,模型选择的重要性不言而喻。不同模型适用于不同的任务,拥有不同的特点。亚马逊云科技 深知这一点,因此在 re:Invent 2024 大会上,亚马逊CEO Andy Jassy特别强调CHOICE MATTERS,不仅集成来自各家厂商的模型,更推出了自研的 Amazon Nova 模型家族,进一步丰富了客户的选择

1.Amazon Bedrock:多样化模型,一站式平台

Amazon Bedrock 不仅仅是一个模型平台,更是一个开放、灵活的 AI 社区。它集成了来自 AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI 等多家领先 AI 公司的模型,为客户提供了丰富的选择。除了这些第三方模型,亚马逊云科技还着重推出了自研的 Amazon Nova 模型家族,体现了其在 AI 模型研发上的自主实力和为客户提供更多选择的决心

Amazon Nova 模型家族: 这是本次 re:Invent 大会的一个亮点,体现了亚马逊云科技在 AI 模型领域的最新进展。Amazon Nova 模型家族包括:

  • • Amazon Nova Micro: 超快速文本生成模型,能够在极低的延迟和成本下提供响应,适合对速度有高要求的场景

  • • Amazon Nova Lite: 高性价比的多模态模型,能够快速处理图像、视频和文本输入,适合多种任务

  • • Amazon Nova Pro: 功能强大的多模态模型,在准确性、速度和成本之间取得了绝佳的平衡,适合多种任务,也可用作训练定制模型的基础

  • • Amazon Nova Premier: 亚马逊的顶级多模态模型,专为复杂推理任务而生,并可用于作为 “教师模型” 来蒸馏定制模型

Amazon Bedrock 的优势在于:

  • • 广泛的模型选择: 不仅涵盖了第三方模型,还包括了自研的 Amazon Nova 模型家族,覆盖了各种任务和场景,让客户可以根据自身需求选择最合适的模型

  • • 易于使用: 提供了统一的 API 接口,让客户可以轻松地使用各种模型

  • • 可定制: 支持微调和模型蒸馏,让客户可以根据自身数据和需求定制模型,尤其是 Amazon Nova 模型还支持模型蒸馏

  • • 安全可靠: 提供了内置的安全和隐私保护功能,确保模型和数据的安全

  • • 持续更新: 不断添加新的模型和功能,保持平台的领先性,也包括了持续对 Amazon Nova 模型家族的优化。

  • • 自研模型的优势: 通过自研 Amazon Nova 模型,亚马逊云科技提供了在性能、成本和定制化方面更灵活的选择,也体现了亚马逊云科技对于 AI 技术自主掌控的决心

2.Amazon Bedrock Marketplace:专业模型,满足特定需求

除了完全托管的模型外,亚马逊云科技还推出了 Amazon Bedrock Marketplace,为客户提供了超过 100 个热门、新兴和专业的模型。这些模型来自不同的供应商,覆盖了金融、医疗、生物等多个领域,满足了客户对专业模型的需求。例如,客户可以选择用于金融行业的 Writer 的 Palmyra-Fin、用于翻译的 Upstage 的 Solar Pro、Camb.ai 的文本转音频 MARS6 以及用于生物学的 EvolutionaryScale 的 ESM3 生成模型等。

Amazon Bedrock Marketplace 的优势在于:

  • • 丰富的专业模型: 覆盖了各个领域,满足了客户特定的业务需求

  • • 便捷的访问方式: 让客户可以轻松地查找和使用各种专业模型

  • • 灵活的部署方式: 客户可以选择最适合的基础设施,将模型部署在亚马逊云科技上

3.优化推理和数据利用:提升 AI 应用效率

除了提供丰富的模型选择外,Amazon Bedrock 还提供了一系列工具,帮助客户优化推理性能和数据利用,从而提升 AI 应用的效率

  • • 提示词缓存和智能路由: 通过缓存常用的提示词和智能路由提示词到最佳模型,降低了推理成本和延迟

  • • Knowledge Bases: 允许客户连接结构化和非结构化数据,并支持 GraphRAG,从而根据自身数据定制模型响应,提高结果的准确性和相关性

  • • Data Automation: 能够自动将非结构化、多模态数据转换为结构化数据,从而更好地应用于 AI 模型中

  • • 模型蒸馏: 允许客户将大型模型的知识转移到小型模型上,从而在降低成本的同时提高运行速度。

  • • 自动化推理检查: 通过逻辑验证来帮助防止模型幻觉,从而开辟了对准确性要求极高的新应用场景

  • • 多智能体协作: 允许客户构建和编排多个 AI 智能体,共同解决复杂问题,从而拓展了 AI 的应用范围

这些工具和功能的推出,体现了 亚马逊云科技在 AI 领域的深入思考。模型选择仅仅是 AI 应用的第一步,更重要的是如何有效地使用这些模型,如何让 AI 真正地为企业创造价值。因此,亚马逊云科技不断推出新的工具和功能,帮助客户优化推理性能和数据利用,从而将 AI 应用推向新的高度

数据管理:一致性、可用性与可扩展性的平衡选择

数据是现代企业最重要的资产之一,如何有效地管理数据,是所有企业都必须面对的挑战。亚马逊云科技在 re:Invent 2024 大会上,推出了 Amazon Aurora DSQL 和 Amazon DynamoDB global tables 的新功能,为客户提供了更多的数据管理选择

Amazon Aurora DSQL:分布式 SQL 数据库的创新

Amazon Aurora DSQL 是一款全新的无服务器分布式 SQL 数据库,它不仅具备传统关系型数据库的优势,还具备了分布式数据库的可扩展性和高可用性

Amazon Aurora DSQL 的特点在于:

  • • 多区域可用性: 提供 99.999% 的多区域可用性,确保应用程序始终可用

  • • 几乎无限的可扩展性: 可以根据需求自动扩展,无需担心性能瓶颈

  • • 强一致性: 确保所有数据在多个区域保持一致

  • • 无服务器: 无需管理底层基础设施,降低了运维成本

  • • 兼容 PostgreSQL: 提供了熟悉的 SQL 接口,降低了使用门槛

Amazon Aurora DSQL 的推出,旨在解决现有分布式 SQL 数据库的不足。传统的分布式 SQL 数据库往往需要在一致性、可用性和扩展性之间做出取舍,而 Amazon Aurora DSQL 则突破了这一限制,实现了三者的完美结合

Amazon DynamoDB global tables:多区域强一致性的提升

Amazon DynamoDB global tables 是一种多区域、多活数据库,提供 99.999% 的可用性,以及对多区域强一致性的支持,确保客户在多区域部署的应用程序始终能够读取最新数据

Amazon DynamoDB global tables 的优势在于:

  • • 高可用性: 提供 99.999% 的可用性,确保应用程序始终运行

  • • 几乎无限的可扩展性: 可以根据需求自动扩展,无需担心性能瓶颈

  • • 零基础设施管理: 无需管理底层基础设施,降低了运维成本

  • • 多区域强一致性: 确保所有数据在多个区域保持一致

Amazon DynamoDB global tables 的创新,不仅提升了数据的一致性,还简化了多区域应用程序的部署和管理

PC端实验

 

在 AI 时代,选择至关重要。亚马逊云科技通过 re:Invent 2024 大会,向世界展示了其对技术选择多样性的深刻理解。从算力、AI 模型到数据管理,亚马逊云科技不仅提供了丰富的选择,更致力于构建一个合作共赢的技术乐园,让客户能够根据自身需求,自由搭配各种技术,释放创新的无限可能,真正实现“选择决定一切”的理念

立即加入!扫描下方二维码,参与 re:Invent 2024 体验计划,深入了解亚马逊云科技前沿技术,开启您的云端创新之旅!

前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务

(文:AI寒武纪)

欢迎分享

发表评论