方向性刺激提示
Li et al., (2023) (在新标签页中打开) 提出了一种新的提示技术,以更好地指导LLM生成所需的摘要。
一个可调策略LM被训练来生成刺激/提示。看到更多使用RL来优化LLMs。
下图展示了方向性刺激提示与标准提示的比较。策略语言模型可以很小,并优化以生成指导黑盒冻结大型语言模型的提示。
图片来源:Li et al., (2023) (在新标签页中打开)
完整示例即将推出!
Li et al., (2023) (在新标签页中打开) 提出了一种新的提示技术,以更好地指导LLM生成所需的摘要。
一个可调策略LM被训练来生成刺激/提示。看到更多使用RL来优化LLMs。
下图展示了方向性刺激提示与标准提示的比较。策略语言模型可以很小,并优化以生成指导黑盒冻结大型语言模型的提示。
图片来源:Li et al., (2023) (在新标签页中打开)
完整示例即将推出!