大型语言模型的中间修订与搜索推理

这项工作由Chi等人（2024）（在新标签页中打开）提出，展示了一种可以在分解为组件的任务上进行通用推理和搜索的方法。

提出的基于图的框架，THOUGHTSCULPT，结合了迭代自我修正能力，并允许LLM构建一个交织的思维网络。

与其他方法（如使用树形结构塑造推理过程的思维树）不同，这种新方法结合了蒙特卡洛树搜索（MCTS）来高效地导航搜索空间。

这种新方法使用了一个由LLM驱动的思维评估器来提供对候选部分输出的反馈。然后，一个思维生成器组件产生潜在的解决方案。思维评估器和思维生成器被视为扩展阶段，有助于完善当前的解决方案。

"ThoughtSculpt"

最后，决策模拟器（作为MCTS过程的一部分）模拟连续的思路来评估路径的潜在价值。

由于其持续思维迭代的能力，THOUGHTSCULPT特别适合诸如开放式生成、多步推理和创意构思等任务。

我们可能会看到更多使用类似概念和搜索算法的高级方法，以提升大型语言模型（LLMs）的推理能力，并增强其解决需要复杂推理和规划问题的能力。这是一篇值得关注的研究趋势的优秀论文。