Transformers 文档

XLM-RoBERTa

Transformers

XLM-RoBERTa

概述

XLM-RoBERTa模型由Alexis Conneau、Kartikay Khandelwal、Naman Goyal、Vishrav Chaudhary、Guillaume Wenzek、Francisco Guzmán、Edouard Grave、Myle Ott、Luke Zettlemoyer和Veselin Stoyanov在《大规模无监督跨语言表示学习》中提出。该模型基于Facebook于2019年发布的RoBERTa模型。它是一个大型多语言语言模型，使用了2.5TB经过过滤的CommonCrawl数据进行训练。

论文的摘要如下：

本文展示了大规模预训练多语言语言模型在各种跨语言迁移任务中带来的显著性能提升。我们基于一百种语言训练了一个基于Transformer的掩码语言模型，使用了超过两TB的过滤后的CommonCrawl数据。我们的模型，称为XLM-R，在各种跨语言基准测试中显著优于多语言BERT（mBERT），包括在XNLI上平均准确率提高了+13.8%，在MLQA上平均F1分数提高了+12.3%，在NER上平均F1分数提高了+2.1%。XLM-R在低资源语言上表现尤为出色，在XNLI准确率上，斯瓦希里语提高了11.8%，乌尔都语提高了9.2%，相比之前的XLM模型。我们还详细评估了实现这些提升所需的关键因素，包括（1）正向迁移与容量稀释之间的权衡，以及（2）大规模下高资源和低资源语言的性能。最后，我们首次展示了在不牺牲单语言性能的情况下进行多语言建模的可能性；XLM-R在GLUE和XNLI基准测试中与强大的单语言模型相比非常有竞争力。我们将公开XLM-R的代码、数据和模型。

该模型由stefan-it贡献。原始代码可以在这里找到。

使用提示

XLM-RoBERTa 是一个在100种不同语言上训练的多语言模型。与一些XLM多语言模型不同，它不需要 lang 张量来理解使用的是哪种语言，并且应该能够从输入ID中确定正确的语言。
在XLM方法上使用RoBERTa技巧，但不使用翻译语言建模目标。它仅对来自一种语言的句子使用掩码语言建模。

资源

以下是官方 Hugging Face 和社区（由🌎表示）提供的资源列表，帮助您开始使用 XLM-RoBERTa。如果您有兴趣提交资源以包含在此处，请随时打开一个 Pull Request，我们将对其进行审核！理想情况下，资源应展示一些新内容，而不是重复现有资源。

Text Classification

一篇关于如何在AWS上使用Habana Gaudi对XLM RoBERTa进行多类分类微调的博客文章
XLMRobertaForSequenceClassification 由这个示例脚本和笔记本支持。
TFXLMRobertaForSequenceClassification 由这个示例脚本和笔记本支持。
FlaxXLMRobertaForSequenceClassification 由这个示例脚本和笔记本支持。
文本分类章节，来自🤗 Hugging Face任务指南。
文本分类任务指南

Token Classification

XLMRobertaForTokenClassification 由这个示例脚本和笔记本支持。
TFXLMRobertaForTokenClassification 由这个示例脚本和笔记本支持。
FlaxXLMRobertaForTokenClassification 由这个示例脚本支持。
Token classification 🤗 Hugging Face 课程的章节。
Token分类任务指南

Text Generation

XLMRobertaForCausalLM 由这个示例脚本和笔记本支持。
Causal language modeling 🤗 Hugging Face 任务指南的章节。
因果语言建模任务指南

Fill-Mask

XLMRobertaForMaskedLM 由这个示例脚本和笔记本支持。
TFXLMRobertaForMaskedLM 由这个示例脚本和笔记本支持。
FlaxXLMRobertaForMaskedLM 由这个示例脚本和笔记本支持。
Masked language modeling 🤗 Hugging Face 课程的章节。
Masked language modeling

Question Answering

XLMRobertaForQuestionAnswering 由这个示例脚本和笔记本支持。
TFXLMRobertaForQuestionAnswering 由这个示例脚本和笔记本支持。
FlaxXLMRobertaForQuestionAnswering 由这个示例脚本支持。
Question answering 章节来自 🤗 Hugging Face 课程。
问答任务指南

多项选择

XLMRobertaForMultipleChoice 由这个示例脚本和笔记本支持。
TFXLMRobertaForMultipleChoice 由这个示例脚本和笔记本支持。
多项选择任务指南

🚀 部署

一篇关于如何在Deploy Serverless XLM RoBERTa on AWS Lambda的博客文章。

此实现与RoBERTa相同。有关使用示例以及输入和输出的相关信息，请参阅RoBERTa的文档。

Transformers

XLM-RoBERTa

概述

使用提示

资源

XLMRobertaConfig

类 transformers.XLMRobertaConfig

XLMRobertaTokenizer

类 transformers.XLMRobertaTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

保存词汇表

XLMRobertaTokenizerFast

类 transformers.XLMRobertaTokenizerFast

build_inputs_with_special_tokens

create_token_type_ids_from_sequences

XLMRobertaModel

类 transformers.XLMRobertaModel

前进

XLMRobertaForCausalLM

类 transformers.XLMRobertaForCausalLM

前进

XLMRobertaForMaskedLM

类 transformers.XLMRobertaForMaskedLM

前进

XLMRobertaForSequenceClassification

类 transformers.XLMRobertaForSequenceClassification

前进

XLMRobertaForMultipleChoice

类 transformers.XLMRobertaForMultipleChoice

前进

XLMRobertaForTokenClassification

类 transformers.XLMRobertaForTokenClassification

前进

XLMRobertaForQuestionAnswering

类 transformers.XLMRobertaForQuestionAnswering

前进

TFXLMRobertaModel

类 transformers.TFXLMRobertaModel

调用

TFXLMRobertaForCausalLM

类 transformers.TFXLMRobertaForCausalLM

调用

TFXLMRobertaForMaskedLM

类 transformers.TFXLMRobertaForMaskedLM

调用

TFXLMRobertaForSequenceClassification

类 transformers.TFXLMRobertaForSequenceClassification

调用

TFXLMRobertaForMultipleChoice

类 transformers.TFXLMRobertaForMultipleChoice

调用

TFXLMRobertaForTokenClassification

类 transformers.TFXLMRobertaForTokenClassification

调用

TFXLMRobertaForQuestionAnswering

类 transformers.TFXLMRobertaForQuestionAnswering

调用

FlaxXLMRobertaModel

类 transformers.FlaxXLMRobertaModel

__call__

FlaxXLMRobertaForCausalLM

类 transformers.FlaxXLMRobertaForCausalLM

__call__

FlaxXLMRobertaForMaskedLM

类 transformers.FlaxXLMRobertaForMaskedLM

__call__

FlaxXLMRobertaForSequenceClassification

类 transformers.FlaxXLMRobertaForSequenceClassification

__call__

FlaxXLMRobertaForMultipleChoice

class transformers.FlaxXLMRobertaForMultipleChoice

__call__

FlaxXLMRobertaForTokenClassification

类 transformers.FlaxXLMRobertaForTokenClassification

__call__

FlaxXLMRobertaForQuestionAnswering

类 transformers.FlaxXLMRobertaForQuestionAnswering

__call__

call

call

call

call

call

call

call