选择大于一切!多模型策略如何成为 AI 时代制胜法宝?

    昨天凌晨,亚马逊云科技宣布在Amazon Bedrock 平台上推出全托管、无服务器的DeepSeek-R1 模型——这是DeepSeek-R1 首次作为全托管、正式商用模型在海外云厂商中推出。

    同时DeepSeek 也是首个登陆Amazon Bedrock的国产大模型——自今年1月底上线以来,已有数千客户通过Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。

    亚马逊 CEO Andy Jassy 第一时间在 linkedin 上发布了这一消息:

    我们使它更容易使用DeepSeek-R1。

    它现在在Amazon Bedrock上作为完全托管模型提供(AWS是第一个提供完全托管、正式可用的云服务提供商)。 无需设置或维护,并且具有创建有影响力、实用的生成式AI应用所需的所有安全保障和工具(如Guardrails、Agents和Knowledge Bases)。

    请尽情使用。https://lnkd.in/eSVEvmiG

    这背后的逻辑,是在 AI 快速发展、模型百花齐放的2025年,各大云厂商纷纷加码投入,想要争夺这一新兴战场的主导权

    模型正百花齐放(图from Hugging Face)
    Gartner 也于近日发布了对 2025年及未来中国企业的人工智能预测——未来两到五年内,中国将发生一系列变革来推动 AI 的普及。并指出:

    2027年,中国80%的企业将使用多模型生成式人工智能策略来实现多样化的模型功能、满足本地部署要求并获得成本效益。

    并且,采用复合型AI的企业将比只依赖生成式人工智能模型的企业领先两年实现AI 落地

    不难理解,多模型的策略将更有助于企业在动荡的市场环境中来充分利用人工智能的能力,相比而言能更有效地管理通用任务和专用任务,而不必仅仅赖单一大语言模型。


    笔者很认同 Gartner 高级研究总监张桐的观点:“通用模型用途广泛,但在小众领域可能表现不佳。相比之下,专业模型在特定领域表现出色,但在处理训练范围之外的任务时,其表现不尽如人意。因此,将出现规模和目的各不相同的多样化模型来满足这些不同的需求


    可以预测,模型使用的多样性和灵活性,将成为企业从竞争中能否胜出的关键。


    模型变局——颠覆者的不断崛起和云厂商的应对之道

    而当我们回顾过去两年 AI 发展史,就会发现一个有趣的现象:最优秀的 AI 模型往往不是来自人们最初预期的科技巨头

    在OpenAI 发布 ChatGPT 之后,从 Claude 的迅速崛起再到开源社区 DeepSeek-R1等模型的横空出世,AI 领域的创新者们不断刷新着我们对模型能力的认知边界。

    尤其是今年初发布的 DeepSeek-R1,其以卓越的推理能力和代码生成能力,在短时间内获得了全球开发者社区的广泛认可。

    这个现象也验证了一个关键洞察:

    顶尖AI模型可能来自任何地方,而非仅限于OpenAI或Google等巨头之手

    对应于企业而言,将会经常会面临的情况是:某个场景先前用的是 LlaMa,但 DeepSeek R1 发布后发现它更为合适;或者今天某业务中用的是Qwen,但明天就需要调整为 Claude 了。

    如何能快人一步,灵活调整,就显得尤为重要。

    在企业客户诉求将趋向于是多而全,而非单一品类单一模型的背后,云厂商们群起争夺市场的关键,将是谁能洞察并把握住这个关键痛点,顺应企业客户的需求趋势。

    当前的OpenAI,Anthropic,xAI,DeepSeek,LlaMa 等模型公司,均仅提供自有模型服务,进驻云厂商,将自身模型能力与其他模型结合供客户选择,将成为必然的发展趋势。

    考验云厂商的模型布局能力的时候到了。

    对各家云厂商对模型的支持情况进行了调研发现秉持选择大于一切理念的亚马逊云科技,基于这一趋势的洞察和提前布局,已构建了一个囊括自研、开源和第三方模型的完整阵营,实现了从经济型到高端的模型全覆盖。

    而排在亚马逊云科技之后的第二名,则是对 OpenAI 进行了资本布局的微软,其靠着 ChatGPT 系列模型也占据了不小的市场份额。

    但随着微软与 OpenAI 在对未来理念上的分歧,及 OpenAI 模型被DeepSeek,Claude 和Grok 等模型的挤压,微软的竞争优势或将进一步减弱。

    一个显著亚马逊云科技基于其及时快速响应市场的能力,已成为模型创新的首选平台——在亚马逊云科技的平台上,有接近200个精选模型涵盖了各个领域和应用场景。

    并且,这一状况似乎进入良性循环。

    亚马逊云科技 Bedrock模型目录

    可以看到,目前亚马逊云科技模型目录已包含186个模型,涵盖从自研的Nova系列,到Claude、DeepSeek、Llama、Mistral、Falcon等众多第三方模型。通过明确的差异化定位,亚马逊云科技为企业客户提供了适应不同场景的丰富选择。

    以几个代表性模型为例:Amazon Nova 作为亚马逊云科技自研的全能型基础模型,具有高性价比和通用性,适合客服、内容生成和企业内部自动化等日常任务;DeepSeek R1 则专精于复杂推理、数学计算和代码生成,是处理需要深度逻辑链任务的理想选择;而 Claude 系列则凭借其顶尖的综合性能,适合处理开放式复杂问题,提供接近人类水平的理解和创意能力。

    有许多 model router 的项目,也正是基于上述需求而生,例如我自己就是自己造了个轮子,来对不同需求来使用不同的模型。

    这里顺便展示一下我在用的模型路由系统,它根据不同 AI 模型的专长和用户的任务类型进行匹配。我是这样定义模型的:

    import requestsfrom typing import DictListAnyOptional
    class AIModel:    def __init__(self, name: str, provider: str, strengths: List[str], use_cases: List[str]):        self.name = name        self.provider = provider        self.strengths = strengths        self.use_cases = use_cases            def describe(self) -> str:        return f"{self.name} by {self.provider}: Specialized in {', '.join(self.strengths)}"        def is_suitable_for(self, task_type: str) -> bool:        return task_type.lower() in [case.lower() for case in self.use_cases]
    class TaskRouter:    def __init__(self):        self.models = []            def register_model(self, model: AIModel) -> None:        self.models.append(model)            def find_best_model(self, task_description: str, task_type: str) -> Optional[AIModel]:        suitable_models = [model for model in self.models if model.is_suitable_for(task_type)]                if not suitable_models:            return None                    # 简单示例,实际应用中需要替换为更合适的匹配算法        # 这里仅依据任务类型返回第一个匹配的模型        return suitable_models[0]            def route_task(self, task_description: str, task_type: str) -> Dict[strAny]:        model = self.find_best_model(task_description, task_type)                if not model:            return {"status""error""message""No suitable model found for this task"}                    return {            "status""success",            "selected_model": model.name,            "provider": model.provider,            "task_description": task_description,            "task_type": task_type        }

    然后把我用到的模型们都进行了实例创建:

    # 创建模型实例amazon_nova = AIModel(    name="Amazon Nova",    provider="Amazon Web Services",    strengths=["高性价比""通用性""企业级解决方案"],    use_cases=["客服对话""内容生成""企业内部自动化""日常助手"])
    deepseek_r1 = AIModel(    name="DeepSeek R1",    provider="DeepSeek AI",    strengths=["复杂推理""数学计算""代码生成""逻辑链分析"],    use_cases=["数学问题求解""算法开发""科学研究""代码生成与调试"])
    claude = AIModel(    name="Claude",    provider="Anthropic",    strengths=["开放式问题""人类水平理解""创意能力""综合性能"],    use_cases=["复杂问题求解""创意写作""多轮对话""开放式讨论"])

    最终的任务路由和使用则可以这样来完成:

    # 创建任务路由器router = TaskRouter()router.register_model(amazon_nova)router.register_model(deepseek_r1)router.register_model(claude)
    # 这里只是示意,实例上可以用类似bert 的model 或4o-mini 的小模型来路四def process_user_request(user_query: str) -> Dict[strAny]:    # 简单示例,实际应用中这部分可能需要更复杂的NLP分析    if "代码" in user_query or "编程" in user_query or "数学" in user_query:        task_type = "代码生成"    elif "创意" in user_query or "写作" in user_query or "开放" in user_query:        task_type = "创意写作"    else:        task_type = "日常助手"            return router.route_task(user_query, task_type)
    # 案例test_queries = [    "帮我写一段Python代码计算斐波那契数列",    "为我的产品创作一段营销文案",    "回答我关于公司政策的问题"]
    for query in test_queries:    result = process_user_request(query)    print(f"查询: '{query}'")    print(f"推荐模型: {result['selected_model']} (由 {result['provider']} 提供)")    print("-" * 50)

    而在github 上,这样的项目也是一搜一大把:

    可见多模型的应用,对开发团队和企业客户而言,已经是必选题。

    而说回亚马逊云科技,其不同定位和价格的模型构成了一个完整谱系,可以让企业根据实际需求和预算来进行更灵活的选择。

    在众多玩家中,亚马逊云科技凭借其独特的战略布局和持续的基础设施投入,正在逐步确立其在 AI 领域的领导地位。亚马逊云科技所以精准击中众多企业用户的切身需求正是因基于对模型变局认知和企业用户的切实需求交叉点,采取的选择大于一切”(Choice Matters) 前瞻策略

    亚马逊云科技 CEO Matt Garman 也在LinkedIn 上分享表示:

    「自从DeepSeek-R1在亚马逊云科技(AWS)上推出以来,我们已经看到了对它的惊人需求,现在我们成为第一个提供它作为完全托管、普遍可用模型的云服务提供商。这意味着强大而又无缝的人工智能,具备所有基本要素:内置安全性全面监控可定制的护栏以及对您数据的完全控制。今天就在 Amazon Bedrock上使用DeepSeek AI 的高级推理模型进行构建。」

    在“选择大于一切”战略下,亚马逊云科技不押注单一赢家,而是打造开放平台,迅速将市场上涌现的优质模型纳入Bedrock/SageMaker生态,为客户提供多样化的选择。

    对企业客户而言,这不仅能降低押注单一模型的风险,也可根据不同场景灵活选择最适合的模型组合。

    资本博弈:云厂商 AI 基础设施投入对比

    支撑这种多模型战略的,是亚马逊云科技在AI基础设施方面的巨额投入。

    亚马逊CEO Andy Jassy在财报会议上指出,2024年第四季度263亿美元资本支出的“绝大部分”都用于亚马逊云科技的AI投资。

    从近两年各大云厂商资本支出数据看,亚马逊云科技的投入力度确实远超竞争对手。

    云厂商资本支出对比

    2024年,亚马逊云科技在基础设施方面的支出达到了830亿美元,远超微软的512亿美元和谷歌的525亿美元。这种大规模投资主要用于AI基础设施建设,为支持多样化的模型策略奠定了坚实基础。

    另外经查阅了相关财报和资料,可以看到这种投资趋势在未来还将继续加强:

    2025年资本支出预测

    预计在2025年,亚马逊云科技的资本支出将达到1000亿美元,继续保持行业领先地位。

    这种面向未来、持续加码的大力投入,也为亚马逊云科技提供了强大的硬件基础,支撑起其多模型战略的实施。

    未来的多模型策略

    结合前文提到的 Gartner 预测:

    到2027年,中国80%的企业将使用多模型生成式 AI 策略来实现多样化的模型功能、满足本地部署要求兵获得成本效益。

    公众号:Gartner公司Gartner发布2025年及未来中国企业实现AI价值的重要预测

    基于当前AI模型格局和实际应用场景,可以预见的是:

    未来主流的企业级AI应用将采用“高性能模型+good-enough模型”的组合策略

    企业实际部署AI应用时,大部分场景并不需要最尖端的大模型,而是需要一个足够好用、安全稳定且成本可控的“好用”模型来处理日常任务。

    只有在特别复杂或创意性任务需求时,才需要调用更高端的专业模型。

    各家云厂商中,值得注意的是,亚马逊云科技在年初以来就开始持续快速集成新模型,我梳理了一下2025年以来亚马逊云科技模型的上线时间线:

    可以看到,亚马逊云科技就不断有模型上新:1月上线DeepSeek-R1,2月则上线了Meta SAM 2.1、Falcon 3 及最新的Claude 3.7 Sonnet,3 月也最新推出了全托管、无服务器的DeepSeek-R1 模型。接下来还将不断有更多更好更新的模型上线。

    这种持续不断的密集式模型更新,也正是亚马逊云科技「选择大于一切」策略的实际体现。

    亚马逊云科技的多模型策略,也恰好契企业“多+好的模型使用这一需求趋势

    例如,企业可以使用经济型的 Nova 处理大量的日常任务,用 DeepSeek R1 处理代码和推理任务,而在需要最高质量输出的场景下调用 Claude。

    这种灵活组合的能力,能够让企业在性能和成本之间找到最佳平衡点,且切换成本极低,业务迭代很快。

    而在提供丰富模型选择的同时,亚马逊云科技也高度重视 AI 应用的安全性

    亚马逊云科技 CEO Matt Garman 指出:

    「安全是构建业务的根基。对于我们来说,安全性在每一项工作中都至关重要。」

    针对DeepSeek等模型可能出现的幻觉、数据隐私等安全挑战,亚马逊云科技提供了全面的三层防护体系:

    1. 基础安全防护:通过Amazon KMS、IAM和VPC等服务,确保模型托管与运营的安全性,提供静态和传输中数据加密、细粒度访问控制等功能

    2. 有害信息处理:Guardrails安全防护栏功能可过滤有害内容、限制特定主题和敏感信息,并通过自动化推理检查功能有效减少模型幻觉

    3. 深度防御策略:构建全面的安全防御体系,覆盖企业架构、全生命周期安全设计、分层防御和信任边界控制等方面

    除了安全防护功能以外,Amazon Bedrock 还提供“一站式”开发组件,包括,知识库、智能体、模型评估、提示词管理,让大模型更简单易用,帮助企业快速落地场景化应用。

    选择大于一切的制胜之道

    DeepSeek R1 的崛起让我们再次看到,顶尖 AI 创新可能来自任何地方,而非仅限于几家科技巨头。在这个 AI 百花齐放的时代,亚马逊云科技通过打造开放的平台生态持续加码基础设施投入、以及构建企业级安全防护,已然建立了其独特的竞争优势。

    这不仅让企业客户能够灵活应对不同场景的 AI 需求,也为整个行业的创新提供了肥沃土壤。同时也更加印证了亚马逊云科技“选择大于一切”(Choice Matters)的策略正当其时。

    对于企业用户而言,无论DeepSeek 还是Nova Claude,能带来商业价值模型动力,各家厂商策略布局需要聚焦商业价值真正企业用户商业诉求出发提前布局解企业用户解决企业用户痛点提前布局企业用户未来企业用户共同成长好地帮助企业实现商业价值。

    纵观厂商布局企业客户选择亚马逊云科技平台构建多元化的模型策略组合, AI 时代的制胜法宝。

    如果你是个人开发者或企业用户的读者,并要想亲身体验多模型开发,可以通过亚马逊云科技最新实验“大模型选型实战”直接参与。

    实验特别设计了趣味性强的测试案例,零门槛、重实践、有趣味,这是一次近距离接触 AI 前沿技术的绝佳机会。

    准备好开启模型探索之旅了吗?

    ——立即扫码,与 AI 零距离接触!

    (文:AGI Hunt)

    欢迎分享

    发表评论