Transformers

RAG

概述

检索增强生成（“RAG”）模型结合了预训练密集检索（DPR）和序列到序列模型的能力。RAG模型检索文档，将其传递给seq2seq模型，然后通过边缘化生成输出。检索器和seq2seq模块从预训练模型初始化，并联合进行微调，使检索和生成都能适应下游任务。

它基于Patrick Lewis、Ethan Perez、Aleksandara Piktus、Fabio Petroni、Vladimir Karpukhin、Naman Goyal、Heinrich Küttler、Mike Lewis、Wen-tau Yih、Tim Rocktäschel、Sebastian Riedel、Douwe Kiela的论文Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks。

论文的摘要如下：

大型预训练语言模型已被证明在其参数中存储了事实知识，并在下游NLP任务上进行微调时取得了最先进的结果。然而，它们访问和精确操作知识的能力仍然有限，因此在知识密集型任务上，它们的性能落后于特定任务的架构。此外，为它们的决策提供来源和更新其世界知识仍然是开放的研究问题。具有可微分访问机制的预训练模型可以克服这个问题，但迄今为止仅在抽取式下游任务中进行了研究。我们探索了一种通用的微调方法，用于检索增强生成（RAG）——这些模型结合了预训练的参量和非参量记忆用于语言生成。我们引入了RAG模型，其中参量记忆是一个预训练的seq2seq模型，非参量记忆是维基百科的密集向量索引，通过预训练的神经检索器访问。我们比较了两种RAG公式，一种在整个生成序列中使用相同的检索段落，另一种可以在每个标记上使用不同的段落。我们在广泛的知识密集型NLP任务上微调和评估了我们的模型，并在三个开放领域QA任务上设定了最先进的水平，优于参量seq2seq模型和特定任务的检索和提取架构。对于语言生成任务，我们发现RAG模型生成的文本比最先进的仅参量seq2seq基线更具体、多样和真实。

该模型由ola13贡献。

使用提示

检索增强生成（“RAG”）模型结合了预训练密集检索（DPR）和Seq2Seq模型的能力。 RAG模型检索文档，将其传递给seq2seq模型，然后通过边缘化生成输出。检索器和seq2seq 模块从预训练模型初始化，并联合微调，使检索和生成都能适应下游任务。

Transformers

RAG

概述

使用提示

RagConfig

类 transformers.RagConfig

from_question_encoder_generator_configs

RagTokenizer

类 transformers.RagTokenizer

Rag 特定输出

类 transformers.models.rag.modeling_rag.RetrievAugLMMarginOutput

类 transformers.models.rag.modeling_rag.RetrievAugLMOutput

RagRetriever

类 transformers.RagRetriever

init_retrieval

postprocess_docs

检索

RagModel

类 transformers.RagModel

前进

RagSequenceForGeneration

类 transformers.RagSequenceForGeneration

前进

生成

RagTokenForGeneration

类 transformers.RagTokenForGeneration

前进

生成

TFRagModel

类 transformers.TFRagModel

调用

TFRagSequenceForGeneration

类 transformers.TFRagSequenceForGeneration

调用

生成

TFRagTokenForGeneration

类 transformers.TFRagTokenForGeneration

调用

生成