影响大模型能力表现的因素，以及提示词在其中扮演的角色和工程化的作用和方法

“ 影响大模型能力的因素有很多，但我们需要具体问题具体分析，不能希望一个技术解决所有问题。”

在人工智能应用场景中，可以说大模型扮演着至关重要的角色，因为大模型是人工智能应用的基座；因此这里就涉及到一个很重要的概念——大模型的能力。

即大模型的能力范围有多大，也就是大模型的能力圈；所以，这里就提出一个问题，大模型的能力是由哪些因素决定的？也可以说怎么提升大模型的能力？而提示词能提升大模型的能力吗？

大模型的能力和提示词工程

大模型的能力是大模型应用中非常关键的一个因素，但很多人可能并不清楚一个模型的能力是由哪些因素决定的；以及怎么开发出一个功能强大的模型。

从大模型的能力范围来说，我们应该从两个角度来区分；一个是怎么激发大模型的能力，另一个是怎么提升大模型的能力。

大模型从被训练出来之后，它的能力圈基本上已经确定了，不会再有太大的变化；但训练完成的大模型就像一个有非常潜力的人，虽然他的能力圈已经确定了，但我们在使用的过程中可能并没有完成激活大模型的能力。

这就类似于我们人类的大脑一样，普通人的大脑开发程度也就仅仅只有10%左右；而被公认为天才的爱因斯坦的大脑也就被开发百分之二十不到。

因此，我们就需要一种方式来激活大模型的能力，这种方法就叫做——提示词工程。

对大部分人来说，一个好的提示词能解决大模型应用过程中百分之八十的问题。

比如说现在网络上有很多关于提示词的模板，本质上就是通过提示词工程的方式来激发大模型的潜力，让大模型在具体问题上表现的更好。

常见的提示词工程方法有角色扮演，目标指定，指定输出格式，增加约束等；而且在不同的场景下，提示词模板也不尽相同。但不管采用哪种提示词模板，其目的只有一个，那就是激发大模型的潜力。

如果说第一种方式是不断激发大模型的潜力，那么第二种方式就是怎么提升大模型的潜力；简单来说就是，人类可以通过学习提升自己的能力和潜力，大模型同样如此。

那怎么提升大模型的潜力呢？

提升大模型的潜力同样涉及多个方面，比如说模型的架构，使用的算法，训练数据的质量等等。

所以总的来说，提升大模型的潜力主要有以下几个方面：

神经网络技术的发展

神经网络技术的发展主要指的是模型架构，算法，学习方式等；比如说Transformer架构的出现使得其神经网络模型在自然语言处理领域得到了跨越式的进步；而强化学习，蒸馏技术等使得模型能力得到巨大提升，不但效果更好，而且成本更低。

训练数据的选择和质量

对同一个神经网络模型，使用不同的训练数据和不同质量的训练数据，会得到不同的效果；比如同一个模型，使用医疗领域的训练数据和使用司法领域的训练数据是完全不同的结果，这就是模型的知识边界。

而同一个模型，都使用医疗领域的训练数据，但由于数据集质量的异同，同样会导致模型效果不一。

模型结构的固有缺陷

大模型不是万能的，神经网络技术也不是万能的；因此不同的神经网络结构只能解决特定领域的问题；因此不同的模型结构在不同领域具有其固有的缺陷，比如说推理模型和生成模型，虽然生成模型也具有推理的能力，但推理模型具备更强的“逻辑思维”能力。

模型微调

模型微调的原理是在训练模型的基础之上，在某个方面进行特定增强；比如说，都是图片生成的模型，但如果使用古风的图片进行微调，那么这个模型在古风生成领域就具备更好的性能和效果。

当然，虽然以上几个方面决定了模型的能力范围，但我们同样可以通过其它方式来提升模型在应用过程中的表现；

除了提示词工程之外，我们还可以使用参数控制，比如温度会影响模型的发挥；其次，也可以通过一些工程化技术来提示模型的表现，比如说多模型协作，RAG增强检索等方式。

在不同的业务场景下，我们不应该痴迷于某一项特定的技术，而是应该选择合适的技术；比如说在通用问答方面，提示词可能会比微调的效果更好，成本更低；而在专业领域，微调模型的效果要比提示词更好。

而在复杂领域，应该使用工程化的方式，把多种技术相结合；比如说RAG检索中，使用语义检索，重排序，比单纯的语义检索效果要更好；而如果再加上精心设计的提示词，可能效果会出乎意料。

大模型的使用核心是“模型基座能力 × 提示词工程 × 系统设计”的三元协同：

在实际应用中：

（文：AI探索时代）