少样本提示

尽管大型语言模型展示了出色的零样本能力，但在使用零样本设置时，它们在更复杂的任务上仍然表现不佳。少样本提示可以作为一种技术，通过在提示中提供示例来引导模型进行上下文学习，从而提高性能。这些示例作为后续示例的条件，我们希望模型生成响应时可以起到引导作用。

根据Touvron等人 2023，当模型被扩展到足够大的规模时，少样本属性首次出现(Kaplan等人，2020)。

让我们通过一个在Brown等人 2020中提出的示例来演示少样本提示。在这个示例中，任务是在句子中正确使用一个新词。

提示:

"whatpu"是一种生长在坦桑尼亚的小型毛茸茸的动物。一个使用单词whatpu的句子示例是：
我们在非洲旅行时看到了这些非常可爱的whatpu。

"farduddle"的意思是快速跳跃。一个使用单词farduddle的句子示例是：

输出:

当我们赢得比赛时，我们都开始快速跳跃以庆祝胜利。

我们可以看到，模型通过仅提供一个示例（即1-shot）就学会了如何执行任务。对于更困难的任务，我们可以尝试增加示例（例如3-shot、5-shot、10-shot等）进行实验。

根据Min等人 2022的研究结果，以下是关于少样本时的示例/范例的一些建议：

“示例指定的标签空间和输入文本的分布都很重要（无论这些标签对于单个输入是否正确）”
你使用的格式也对性能起着关键作用，即使你只是使用随机标签，这比没有标签要好得多。
额外的结果显示，从真实标签分布中选择随机标签（而不是均匀分布）也有助于提高性能。

让我们尝试一些示例。让我们首先尝试一个带有随机标签的示例（意味着将标签Negative和Positive随机分配给输入）：

提示:

这太棒了！ // Negative
这太糟糕了！ // Positive
哇，那部电影太棒了！ // Positive
这是一个可怕的节目！ //

输出:

Negative

即使标签已被随机化，我们仍然得到了正确答案。请注意，我们还保持了格式，这也有助于结果。事实上，通过进一步实验，似乎我们正在尝试的新型GPT模型对于即使是随机格式也变得更加稳健。例如：

提示:

Positive 这太棒了！ 
这太糟糕了！ Negative
哇，那部电影太棒了！
Positive
这是一个可怕的节目！ --

输出:

Negative

上面的格式不一致，但模型仍然预测出了正确的标签。我们需要进行更彻底的分析，以确认这是否适用于不同和更复杂的任务，包括提示的不同变体。