Transformers 文档

RoFormer

Transformers

RoFormer

概述

RoFormer模型由Jianlin Su、Yu Lu、Shengfeng Pan、Bo Wen和Yunfeng Liu在RoFormer: Enhanced Transformer with Rotary Position Embedding中提出。

论文的摘要如下：

在Transformer架构中，位置编码为序列中不同位置的元素之间的依赖关系建模提供了监督。我们研究了在基于Transformer的语言模型中编码位置信息的各种方法，并提出了一种名为旋转位置嵌入（RoPE）的新实现。所提出的RoPE通过旋转矩阵编码绝对位置信息，并自然地在自注意力公式中融入了显式的相对位置依赖。值得注意的是，RoPE具有一些有价值的特性，例如能够扩展到任何序列长度、随着相对距离增加而衰减的令牌间依赖关系，以及能够为线性自注意力配备相对位置编码。因此，配备了旋转位置嵌入的增强型Transformer，即RoFormer，在长文本任务中表现出色。我们发布了理论分析以及一些在中文数据上的初步实验结果。正在进行中的英文基准测试实验将很快更新。

该模型由junnyu贡献。原始代码可以在这里找到。

使用提示

RoFormer 是一种类似于 BERT 的自编码模型，具有旋转位置嵌入。旋转位置嵌入在长文本分类任务中表现出更好的性能。

Transformers

RoFormer

概述

使用提示

资源

RoFormerConfig

类 transformers.RoFormerConfig

RoFormerTokenizer

类 transformers.RoFormerTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

保存词汇表

RoFormerTokenizerFast

类 transformers.RoFormerTokenizerFast

build_inputs_with_special_tokens

RoFormerModel

类 transformers.RoFormerModel

前进

RoFormerForCausalLM

类 transformers.RoFormerForCausalLM

前进

RoFormerForMaskedLM

类 transformers.RoFormerForMaskedLM

前进

RoFormerForSequenceClassification

类 transformers.RoFormerForSequenceClassification

前进

RoFormerForMultipleChoice

类 transformers.RoFormerForMultipleChoice

前进

RoFormerForTokenClassification

类 transformers.RoFormerForTokenClassification

前进

RoFormerForQuestionAnswering

类 transformers.RoFormerForQuestionAnswering

前进

TFRoFormerModel

类 transformers.TFRoFormerModel

调用

TFRoFormerForMaskedLM

类 transformers.TFRoFormerForMaskedLM

调用

TFRoFormerForCausalLM

类 transformers.TFRoFormerForCausalLM

调用

TFRoFormerForSequenceClassification

类 transformers.TFRoFormerForSequenceClassification

调用

TFRoFormerForMultipleChoice

类 transformers.TFRoFormerForMultipleChoice

调用

TFRoFormerForTokenClassification

类 transformers.TFRoFormerForTokenClassification

调用

TFRoFormerForQuestionAnswering

类 transformers.TFRoFormerForQuestionAnswering

调用

FlaxRoFormerModel

类 transformers.FlaxRoFormerModel

__call__

FlaxRoFormerForMaskedLM

类 transformers.FlaxRoFormerForMaskedLM

__call__

FlaxRoFormerForSequenceClassification

类 transformers.FlaxRoFormerForSequenceClassification

__call__

FlaxRoFormerForMultipleChoice

类 transformers.FlaxRoFormerForMultipleChoice

__call__

FlaxRoFormerForTokenClassification

类 transformers.FlaxRoFormerForTokenClassification

__call__

FlaxRoFormerForQuestionAnswering

类 transformers.FlaxRoFormerForQuestionAnswering

__call__

call

call

call

call

call

call