Transformers 文档

漏斗变换器

Transformers

漏斗变压器

概述

Funnel Transformer模型在论文Funnel-Transformer: Filtering out Sequential Redundancy for Efficient Language Processing中被提出。它是一个双向Transformer模型，类似于BERT，但在每一层块之后有一个池化操作，有点像计算机视觉中的传统卷积神经网络（CNN）。

论文的摘要如下：

随着语言预训练的成功，开发更具扩展性的高效架构以更低成本利用大量未标记数据变得非常必要。为了提高效率，我们研究了在维护完整长度标记级表示时被忽视的冗余问题，特别是对于只需要序列的单一向量表示的任务。基于这一直觉，我们提出了Funnel-Transformer，它逐渐将隐藏状态序列压缩为更短的序列，从而减少计算成本。更重要的是，通过将长度减少节省的FLOPs重新投入到构建更深或更宽的模型中，我们进一步提高了模型的能力。此外，为了满足常见预训练目标所需的标记级预测，Funnel-Transformer能够通过解码器从减少的隐藏序列中恢复每个标记的深层表示。实验表明，在相当或更少的FLOPs下，Funnel-Transformer在多种序列级预测任务上优于标准Transformer，包括文本分类、语言理解和阅读理解。

该模型由sgugger贡献。原始代码可以在这里找到。

使用提示

由于Funnel Transformer使用池化，隐藏状态的序列长度在每一层块之后都会发生变化。这样，它们的长度被除以2，从而加速了下一个隐藏状态的计算。因此，基础模型的最终序列长度是原始长度的四分之一。这个模型可以直接用于只需要句子摘要的任务（如序列分类或多选）。对于其他任务，使用完整模型；这个完整模型有一个解码器，将最终隐藏状态上采样到与输入相同的序列长度。
对于分类等任务，这不是问题，但对于像掩码语言建模或标记分类这样的任务，我们需要一个与原始输入序列长度相同的隐藏状态。在这些情况下，最终的隐藏状态会被上采样到输入序列长度，并通过两个额外的层。这就是为什么每个检查点有两个版本。带有“-base”后缀的版本仅包含三个块，而没有该后缀的版本包含三个块以及带有额外层的上采样头。
Funnel Transformer 的检查点都有完整版本和基础版本。第一个版本应该用于 FunnelModel, FunnelForPreTraining, FunnelForMaskedLM, FunnelForTokenClassification 和 FunnelForQuestionAnswering。第二个版本应该用于 FunnelBaseModel, FunnelForSequenceClassification 和 FunnelForMultipleChoice。

Transformers

漏斗变压器

概述

使用提示

资源

漏斗配置

类 transformers.FunnelConfig

FunnelTokenizer

类 transformers.FunnelTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

保存词汇表

FunnelTokenizerFast

类 transformers.FunnelTokenizerFast

build_inputs_with_special_tokens

create_token_type_ids_from_sequences

Funnel 特定输出

类 transformers.models.funnel.modeling_funnel.FunnelForPreTrainingOutput

类 transformers.models.funnel.modeling_tf_funnel.TFFunnelForPreTrainingOutput

FunnelBaseModel

类 transformers.FunnelBaseModel

前进

漏斗模型

类 transformers.FunnelModel

前进

FunnelModelForPreTraining

类 transformers.FunnelForPreTraining

前进

FunnelForMaskedLM

类 transformers.FunnelForMaskedLM

前进

FunnelForSequenceClassification

类 transformers.FunnelForSequenceClassification

前进

FunnelForMultipleChoice

类 transformers.FunnelForMultipleChoice

前进

FunnelForTokenClassification

类 transformers.FunnelForTokenClassification

前进

FunnelForQuestionAnswering

类 transformers.FunnelForQuestionAnswering

前进

TFFunnelBaseModel

类 transformers.TFFunnelBaseModel

调用

TFFunnelModel

类 transformers.TFFunnelModel

调用

TFFunnelModelForPreTraining

类 transformers.TFFunnelForPreTraining

调用

TFFunnelForMaskedLM

类 transformers.TFFunnelForMaskedLM

调用

TFFunnelForSequenceClassification

类 transformers.TFFunnelForSequenceClassification

调用

TFFunnelForMultipleChoice

类 transformers.TFFunnelForMultipleChoice

调用

TFFunnelForTokenClassification

类 transformers.TFFunnelForTokenClassification

调用

TFFunnelForQuestionAnswering

类 transformers.TFFunnelForQuestionAnswering

调用