跳到主要内容

自动提示工程师(APE)

APE 图片来源:Zhou 等,(2022)

Zhou 等,(2022) 提出了自动提示工程师(APE),这是一个用于自动生成和选择指令的框架。指令生成问题被构建为自然语言合成,通过使用LLMs来生成和搜索候选解决方案,被视为一个黑盒优化问题。

第一步涉及一个大型语言模型(作为推理模型),该模型接收输出演示以生成任务的指令候选解决方案。这些候选解决方案将指导搜索过程。指令使用目标模型执行,然后根据计算的评估分数选择最合适的指令。

APE 发现了一个比人工设计的“让我们逐步思考”提示更好的零样本 CoT 提示(Kojima 等,2022)。

提示“让我们逐步解决问题,以确保我们得到正确答案。”引发了思维链条推理,并提高了在 MultiArith 和 GSM8K 基准测试上的性能:

APECOT 图片来源:Zhou 等,(2022)

这篇论文涉及与提示工程相关的一个重要主题,即自动优化提示的概念。虽然我们在本指南中没有深入探讨这个主题,但如果您对该主题感兴趣,以下是一些关键论文:

  • Prompt-OIRL - 提出使用离线逆强化学习生成查询相关提示。
  • OPRO - 引入使用LLMs优化提示的概念:让LLMs“深呼吸”可以提高数学问题的性能。
  • AutoPrompt - 提出一种根据梯度引导搜索自动为各种任务创建提示的方法。
  • Prefix Tuning - 一种轻量级的微调替代方案,为自然语言生成任务添加一个可训练的连续前缀。
  • Prompt Tuning - 提出通过反向传播学习软提示的机制。