Transformers 文档

LLaMA

Transformers

LLaMA

概述

LLaMA模型由Hugo Touvron、Thibaut Lavril、Gautier Izacard、Xavier Martinet、Marie-Anne Lachaux、Timothée Lacroix、Baptiste Rozière、Naman Goyal、Eric Hambro、Faisal Azhar、Aurelien Rodriguez、Armand Joulin、Edouard Grave、Guillaume Lample在LLaMA: Open and Efficient Foundation Language Models中提出。它是一系列基础语言模型的集合，参数范围从7B到65B。

论文的摘要如下：

我们介绍了LLaMA，这是一系列基础语言模型，参数范围从7B到65B。我们在数万亿的标记上训练我们的模型，并展示了仅使用公开可用的数据集就可以训练出最先进的模型，而无需依赖专有和不可访问的数据集。特别是，LLaMA-13B在大多数基准测试中优于GPT-3（175B），而LLaMA-65B与最佳模型Chinchilla-70B和PaLM-540B具有竞争力。我们将所有模型发布给研究社区。

该模型由zphang贡献，并得到了BlackSamorez的贡献。Hugging Face中的实现代码基于GPT-NeoX 这里。作者的原始代码可以在这里找到。

使用提示

LLaMA模型的权重可以通过填写此表格获得
下载权重后，需要使用转换脚本将其转换为Hugging Face Transformers格式。可以使用以下（示例）命令调用脚本：

python src/transformers/models/llama/convert_llama_weights_to_hf.py \
    --input_dir /path/to/downloaded/llama/weights --model_size 7B --output_dir /output/path

转换后，可以通过以下方式加载模型和分词器：

from transformers import LlamaForCausalLM, LlamaTokenizer

tokenizer = LlamaTokenizer.from_pretrained("/output/path")
model = LlamaForCausalLM.from_pretrained("/output/path")

请注意，执行脚本需要足够的CPU内存来以float16精度托管整个模型（即使最大的版本分为多个检查点，每个检查点都包含模型每个权重的一部分，因此我们需要将所有内容加载到内存中）。对于65B模型，因此需要130GB的内存。

LLaMA 分词器是一个基于 sentencepiece 的 BPE 模型。sentencepiece 的一个特点是，当解码一个序列时，如果第一个标记是单词的开头（例如“Banana”），分词器不会在字符串前添加前缀空格。

该模型由zphang贡献，并得到了BlackSamorez的贡献。Hugging Face中的实现代码基于GPT-NeoX这里。作者的原始代码可以在这里找到。Flax版本的实现由afmck贡献，实现中的代码基于Hugging Face的Flax GPT-Neo。

基于原始的LLaMA模型，Meta AI发布了一些后续工作：

Llama2: Llama2 是 Llama 的改进版本，进行了一些架构调整（Grouped Query Attention），并在 2 万亿个标记上进行了预训练。请参阅 Llama2 的文档，可以在此处找到 here。

资源

以下是官方 Hugging Face 和社区（由🌎表示）提供的资源列表，帮助您开始使用 LLaMA。如果您有兴趣提交资源以包含在此处，请随时打开一个 Pull Request，我们将进行审核！理想情况下，资源应展示一些新内容，而不是重复现有资源。

Text Classification

一个关于如何使用提示调优来使LLaMA模型适应文本分类任务的notebook。🌎

Question Answering

StackLLaMA: 使用RLHF训练LLaMA的实践指南, 一篇关于如何使用RLHF训练LLaMA在Stack Exchange上回答问题的博客文章。

⚗️ 优化

一个关于如何在内存有限的GPU上使用xturing库微调LLaMA模型的notebook。🌎

⚡️ 推理

一个关于如何使用🤗 PEFT库中的PeftModel运行LLaMA模型的notebook。🌎
一个关于如何使用LangChain加载PEFT适配器LLaMA模型的notebook。🌎

🚀 部署

一个关于如何使用🤗 PEFT库通过LoRA方法微调LLaMA模型的notebook，具有直观的用户界面。🌎
一个关于如何在Amazon SageMaker上部署Open-LLaMA模型进行文本生成的notebook。🌎

Transformers

LLaMA

概述

使用提示

资源

LlamaConfig

类 transformers.LlamaConfig

LlamaTokenizer

类 transformers.LlamaTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

保存词汇表

LlamaTokenizerFast

类 transformers.LlamaTokenizerFast

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

update_post_processor

保存词汇表

LlamaModel

类 transformers.LlamaModel

前进

LlamaForCausalLM

类 transformers.LlamaForCausalLM

前进

LlamaForSequenceClassification

类 transformers.LlamaForSequenceClassification

前进

LlamaForQuestionAnswering

类 transformers.LlamaForQuestionAnswering

前进

LlamaForTokenClassification

类 transformers.LlamaForTokenClassification

前进

FlaxLlamaModel

类 transformers.FlaxLlamaModel

__call__

FlaxLlamaForCausalLM

类 transformers.FlaxLlamaForCausalLM

__call__

call

call