大型语言模型的中间修订与搜索推理
这项工作由Chi等人(2024)(在新标签页中打开)提出,展示了一种可以在分解为组件的任务上进行通用推理和搜索的方法。
提出的基于图的框架,THOUGHTSCULPT,结合了迭代自我修正能力,并允许LLM构建一个交织的思维网络。
与其他方法(如使用树形结构塑造推理过程的思维树)不同,这种新方法结合了蒙特卡洛树搜索(MCTS)来高效地导航搜索空间。
这种新方法使用了一个由LLM驱动的思维评估器来提供对候选部分输出的反馈。然后,一个思维生成器组件产生潜在的解决方案。思维评估器和思维生成器被视为扩展阶段,有助于完善当前的解决方案。
最后,决策模拟器(作为MCTS过程的一部分)模拟连续的思路来评估路径的潜在价值。
由于其持续思维迭代的能力,THOUGHTSCULPT特别适合诸如开放式生成、多步推理和创意构思等任务。
我们可能会看到更多使用类似概念和搜索算法的高级方法,以提升大型语言模型(LLMs)的推理能力,并增强其解决需要复杂推理和规划问题的能力。这是一篇值得关注的研究趋势的优秀论文。