Replicate
Replicate 是一个机器学习模型的 API。它目前托管了诸如 Llama v2、Gemma 和 Mistral/Mixtral 等模型。
要运行一个模型,请指定 Replicate 模型名称和版本,如下所示:
replicate:replicate/llama70b-v2-chat:e951f18578850b652510200860fc4ea62b3b16fac280f83ff32282f87bbd2e48
示例
以下是使用 Replicate 上的 Llama 的示例。对于 Llama,版本哈希和 config
下的所有内容都是可选的:
providers:
- id: replicate:meta/llama-2-7b-chat
config:
temperature: 0.01
max_length: 1024
prompt:
prefix: '[INST] '
suffix: ' [/INST]'
以下是使用 Replicate 上的 Gemma 的示例。请注意,与 Llama 不同,它没有默认版本,因此我们指定了模型版本:
providers:
- id: replicate:google-deepmind/gemma-7b-it:2790a695e5dcae15506138cc4718d1106d0d475e6dca4b1d43f42414647993d5
config:
temperature: 0.01
max_new_tokens: 1024
prompt:
prefix: "<start_of_turn>user\n"
suffix: "<end_of_turn>\n<start_of_turn>model"
配置
Replicate 提供者支持多个 配置选项,可用于自定义模型的行为,如下所示:
参数 | 描述 |
---|---|
temperature | 控制生成过程中的随机性。 |
max_length | 指定生成文本的最大长度。 |
max_new_tokens | 限制生成的新令牌数量。 |
top_p | 核采样:0 到 1 之间的浮点数。 |
top_k | 前 k 采样:保留的最高概率令牌数量。 |
repetition_penalty | 对生成文本中的重复单词进行惩罚。 |
system_prompt | 为所有请求设置系统级提示。 |
stop_sequences | 指定停止序列,以终止生成。 |
seed | 设置种子以获得可重复的结果。 |
warning
并非每个模型都支持每个完成参数。请务必在之前查看模型提供的 API。
这些参数适用于所有模型:
参数 | 描述 |
---|---|
apiKey | 用于与 Replicate 进行身份验证的 API 密钥。 |
prompt.prefix | 在每个提示前添加的字符串。适用于指令/聊天格式化。 |
prompt.suffix | 在每个提示后添加的字符串。适用于指令/聊天格式化。 |
支持的环境变量:
REPLICATE_API_TOKEN
- 您的 Replicate API 密钥。REPLICATE_API_KEY
- 用于 API 密钥的替代变量REPLICATE_API_TOKEN
。REPLICATE_MAX_LENGTH
- 指定生成文本的最大长度。REPLICATE_TEMPERATURE
- 控制生成过程中的随机性。REPLICATE_REPETITION_PENALTY
- 对生成文本中的重复单词进行惩罚。REPLICATE_TOP_P
- 控制核采样:0 到 1 之间的浮点数。REPLICATE_TOP_K
- 控制前 k 采样:保留的最高概率词汇令牌数量。REPLICATE_SEED
- 设置种子以获得可重复的结果。REPLICATE_STOP_SEQUENCES
- 指定停止序列,以终止生成。REPLICATE_SYSTEM_PROMPT
- 为所有请求设置系统级提示。
图像
像 SDXL 这样的图像生成器可以这样使用:
prompts:
- '生成图像:{{subject}}'
providers:
- id: replicate:image:stability-ai/sdxl:7762fd07cf82c948538e41f63f77d685e02b063e37e496e96eefd46c929f9bdc
config:
width: 768
height: 768
num_inference_steps: 50
tests:
- vars:
subject: 水果圈
图像支持的参数
这些参数适用于图像生成模型:
参数 | 描述 |
---|---|
width | 生成图像的宽度。 |
height | 生成图像的高度。 |
refine | 使用哪种细化样式 |
apply_watermark | 在生成的图像上应用水印。 |
num_inference_steps | 在图像生成过程中使用的推理步骤数量。 |
warning
并非每个模型都支持所有图像参数。请务必在使用前查看模型提供的API。
支持的图像环境变量:
REPLICATE_API_TOKEN
- 您的Replicate API密钥。REPLICATE_API_KEY
- 用于API密钥的REPLICATE_API_TOKEN
的替代项。