方向性刺激提示
Li et al., (2023) 提出了一种新的提示技术,以更好地引导LLM生成所需的摘要。
一个可调节的策略LM被训练来生成刺激/提示。看到了更多使用RL来优化LLMs的情况。
下图显示了方向性刺激提示与标准提示的比较。策略LM可以很小,并且被优化以生成引导黑匣子冻结的LLM的提示。
图片来源:Li et al., (2023)
即将推出完整示例!
Li et al., (2023) 提出了一种新的提示技术,以更好地引导LLM生成所需的摘要。
一个可调节的策略LM被训练来生成刺激/提示。看到了更多使用RL来优化LLMs的情况。
下图显示了方向性刺激提示与标准提示的比较。策略LM可以很小,并且被优化以生成引导黑匣子冻结的LLM的提示。
图片来源:Li et al., (2023)
即将推出完整示例!