自动提示工程师(APE)
图片来源:Zhou 等,(2022)
Zhou 等,(2022) 提出了自动提示工程师(APE),这是一个用于自动生成和选择指令的框架。指令生成问题被构建为自然语言合成,通过使用LLMs来生成和搜索候选解决方案,被视为一个黑盒优化问题。
第一步涉及一个大型语言模型(作为推理模型),该模型接收输出演示以生成任务的指令候选解决方案。这些候选解决方案将指导搜索过程。指令使用目标模型执行,然后根据计算的评估分数选择最合适的指令。
APE 发现了一个比人工设计的“让我们逐步思考”提示更好的零样本 CoT 提示(Kojima 等,2022)。
提示“让我们逐步解决问题,以确保我们得到正确 答案。”引发了思维链条推理,并提高了在 MultiArith 和 GSM8K 基准测试上的性能:
图片来源:Zhou 等,(2022)
这篇论文涉及与提示工程相关的一个重要主题,即自动优化提示的概念。虽然我们在本指南中没有深入探讨这个主题,但如果您对该主题感兴趣,以下是一些关键论文:
- Prompt-OIRL - 提出使用离线逆强化学习生成查询相关提示。
- OPRO - 引入使用LLMs优化提示的概念:让LLMs“深呼吸”可以提高数学问题的性能。
- AutoPrompt - 提出一种根据梯度引导搜索自动为各种任务创建提示的方法。
- Prefix Tuning - 一种轻量级的微调替代方案,为自然语言生成任务添加一个可训练的连续前缀。
- Prompt Tuning - 提出通过反向传播学习软提示的机制。