Transformers

Blenderbot

概述

Blender聊天机器人模型是在2020年4月30日由Stephen Roller、Emily Dinan、Naman Goyal、Da Ju、Mary Williamson、Yinhan Liu、Jing Xu、Myle Ott、Kurt Shuster、Eric M. Smith、Y-Lan Boureau、Jason Weston在构建开放域聊天机器人的配方中提出的。

论文的摘要如下：

构建开放领域的聊天机器人是机器学习研究中的一个具有挑战性的领域。虽然之前的工作表明，通过增加神经模型的参数数量和训练数据的规模可以改善结果，但我们表明，其他因素对于高性能聊天机器人同样重要。良好的对话需要多种技能，这些技能由专家对话者无缝地融合在一起：提供引人入胜的谈话要点并倾听他们的伙伴，适当地展示知识、同理心和个性，同时保持一致的角色。我们表明，当提供适当的训练数据和生成策略选择时，大规模模型可以学习这些技能。我们构建了这些方法的变体，包括90M、2.7B和9.4B参数的模型，并将我们的模型和代码公开。人类评估显示，我们的最佳模型在多轮对话中的吸引力和人性化测量方面优于现有方法。然后，我们通过分析模型的失败案例来讨论这项工作的局限性。

该模型由sshleifer贡献。作者的代码可以在这里找到。

使用提示和示例

Blenderbot 是一个具有绝对位置嵌入的模型，因此通常建议在右侧填充输入，而不是左侧。

一个示例：

>>> from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration

>>> mname = "facebook/blenderbot-400M-distill"
>>> model = BlenderbotForConditionalGeneration.from_pretrained(mname)
>>> tokenizer = BlenderbotTokenizer.from_pretrained(mname)
>>> UTTERANCE = "My friends are cool but they eat too many carbs."
>>> inputs = tokenizer([UTTERANCE], return_tensors="pt")
>>> reply_ids = model.generate(**inputs)
>>> print(tokenizer.batch_decode(reply_ids))
["<s> That's unfortunate. Are they trying to lose weight or are they just trying to be healthier?</s>"]

实现说明

Blenderbot 使用基于标准 seq2seq 模型转换器的架构。
可用的检查点可以在模型中心找到。
这是默认的Blenderbot模型类。然而，一些较小的检查点，例如 facebook/blenderbot_small_90M，具有不同的架构，因此应该与 BlenderbotSmall一起使用。

Transformers

Blenderbot

概述

使用提示和示例

实现说明

资源

BlenderbotConfig

类 transformers.BlenderbotConfig

BlenderbotTokenizer

类 transformers.BlenderbotTokenizer

build_inputs_with_special_tokens

BlenderbotTokenizerFast

类 transformers.BlenderbotTokenizerFast

build_inputs_with_special_tokens

BlenderbotModel

类 transformers.BlenderbotModel

前进

BlenderbotForConditionalGeneration

类 transformers.BlenderbotForConditionalGeneration

前进

BlenderbotForCausalLM

类 transformers.BlenderbotForCausalLM

前进

TFBlenderbotModel

类 transformers.TFBlenderbotModel

调用

TFBlenderbotForConditionalGeneration

类 transformers.TFBlenderbotForConditionalGeneration

调用

FlaxBlenderbotModel

类 transformers.FlaxBlenderbotModel

__call__

编码

解码

FlaxBlenderbotForConditionalGeneration

类 transformers.FlaxBlenderbotForConditionalGeneration

__call__

编码

解码

call

call