跳到主要内容

自洽性

也许对于提示工程而言,自洽性是更为先进的技术之一。由 Wang 等人 (2022) 提出,自洽性旨在“取代链式思维提示中使用的朴素贪婪解码”。其思想是通过少样本 CoT 抽样多样化的推理路径,并利用生成结果选择最一致的答案。这有助于提升 CoT 提示在涉及算术和常识推理的任务中的性能。

让我们尝试以下算术推理示例:

提示:

当我6岁时,我妹妹是我的一半年龄。现在我70岁了,我妹妹多大了?

输出:

35

输出是错误的!我们如何利用自洽性来改进这个问题呢?让我们试一试。我们将使用 Wang 等人 2022 年的少样本示例(表 17):

提示:

Q: 林中有15棵树。林地工人今天将在林中种树。完成后,林中将有21棵树。林地工人今天种了多少棵树?
A: 我们从15棵树开始。后来有21棵树。差值必定是他们种下的树的数量。因此,他们必定种下了 21 - 15 = 6 棵树。答案是6。

Q: 如果停车场有3辆车,又有2辆车到达,停车场现在有多少辆车?
A: 停车场已经有3辆车了。又来了2辆。现在总共有 3 + 2 = 5 辆车。答案是5。

Q: Leah 有32块巧克力,她妹妹有42块。如果他们吃掉了35块,他们总共还剩下多少块?
A: Leah 有32块巧克力,Leah 的妹妹有42块。这意味着最初有32 + 42 = 74 块巧克力。已经吃掉了35块。所以他们总共还剩下 74 - 35 = 39 块巧克力。答案是39。

Q: Jason 有20根棒棒糖。他给了 Denny 一些棒棒糖。现在 Jason 只剩下12根棒棒糖。Jason 给了 Denny 多少根棒棒糖?
A: Jason 有20根棒棒糖。因为现在只剩下12根,所以他必定把剩下的给了 Denny。他给了 Denny 的棒棒糖数量必定是 20 - 12 = 8 根。答案是8。

Q: Shawn 有五个玩具。圣诞节时,他从爸爸妈妈那里各得到两个玩具。现在他有多少个玩具?
A: 他有5个玩具。他从妈妈那里得到2个,所以之后他有 5 + 2 = 7 个玩具。然后他又从爸爸那里得到2个,所以总共他有 7 + 2 = 9 个玩具。答案是9。

Q: 服务器房间里有九台电脑。从周一到周四,每天增加五台电脑。现在服务器房间里有多少台电脑?
A: 从周一到周四有4天。每天增加5台电脑。这意味着总共增加了 4 * 5 = 20 台电脑。一开始有9台电脑,所以现在有 9 + 20 = 29 台电脑。答案是29。

Q: Michael 有58个高尔夫球。星期二,他丢失了23个高尔夫球。星期三,他又丢失了2个。星期三结束时他还有多少个高尔夫球?
A: Michael 最初有58个球。星期二丢失了23个,所以之后他有 58 - 23 = 35 个球。星期三又丢失了2个,所以现在他有 35 - 2 = 33 个球。答案是33。

Q: Olivia 有23美元。她买了5个每个3美元的百吉饼。她还剩下多少钱?
A: 她买了5个每个3美元的百吉饼。这意味着她花了15美元。她还剩下8美元。

Q: 当我6岁时,我的妹妹是我的一半年龄。现在我70岁了,我的妹妹多大了?
A:

输出 1:

当我6岁时,我的妹妹是我的一半年龄,所以她是3岁。现在我70岁了,所以她是 70 - 3 = 67 岁。答案是67。

输出 2:

当叙述者6岁时,他的妹妹是他的一半年龄,也就是3岁。现在叙述者70岁了,他的妹妹应该是 70 - 3 = 67 岁。答案是67。

输出 3:

当我6岁时,我的妹妹是我的一半年龄,所以她是3岁。现在我70岁了,所以她是 70/2 = 35 岁。答案是35。

计算最终答案涉及几个步骤(详细内容请参阅论文),但为简单起见,我们可以看到已经出现了一个多数答案,因此这基本上将成为最终答案。