跳到主要内容

用中间修订和搜索进行LLMs推理

这项由Chi等人(2024)完成的工作提出了一种适用于可分解成组件的任务的一般推理和搜索方法。

所提出的基于图的框架THOUGHTSCULPT融合了迭代自我修订功能,使LLM能够构建一个交织的思维网络。

与其他方法(如Tree-of-thoughts)通过树形状塑造推理过程不同,这种新方法融合了蒙特卡洛树搜索(MCTS)以有效地导航搜索空间。

这种新方法利用LLM驱动的思维评估器对候选部分输出进行反馈。然后,思维生成器组件生成潜在解决方案。思维评估器和思维生成器被视为扩展阶段,有助于完善当前解决方案。

"ThoughtSculpt"

最后,决策模拟器(作为MCTS过程的一部分)模拟连续的思维线路,评估路径的潜在价值。

由于其连续思维迭代能力,THOUGHTSCULPT特别适用于诸如开放式生成、多步推理和创意构思等任务。

我们可能会看到更多使用类似概念和搜索算法来提升LLMs推理能力以及解决需要复杂推理和规划的问题的先进方法。这是一篇关注这一研究趋势的重要论文。