检索增强生成（RAG）

通用语言模型可以进行微调，以实现诸如情感分析和命名实体识别等几种常见任务。这些任务通常不需要额外的背景知识。

对于更复杂和知识密集的任务，可以构建基于语言模型的系统，访问外部知识源以完成任务。这样可以实现更多的事实一致性，提高生成响应的可靠性，并有助于缓解“幻觉”问题。

Meta AI 研究人员提出了一种称为检索增强生成（RAG）的方法来解决这类知识密集型任务。RAG将信息检索组件与文本生成模型结合起来。RAG可以进行微调，其内部知识可以高效修改，而无需重新训练整个模型。

RAG接受输入并在给定源（例如维基百科）的情况下检索一组相关/支持文档。这些文档与原始输入提示连接起来作为上下文，并馈送给文本生成器，生成最终输出。这使得RAG适应了事实可能随时间演变的情况。这在 LLMs 的参数化知识是静态的情况下非常有用。RAG允许语言模型绕过重新训练，通过基于检索的生成访问最新信息以生成可靠输出。

Lewis 等人（2021）提出了一个适用于 RAG 的通用微调配方。预训练的 seq2seq 模型用作参数化内存，而维基百科的密集向量索引用作非参数化内存（通过使用神经预训练的检索器进行访问）。下面是该方法的工作概述：

RAG