Skip to main content
Open In ColabOpen on GitHub

MLX 本地管道

MLX 模型可以通过 MLXPipeline 类在本地运行。

MLX 社区托管了超过150个模型,所有模型都是开源的,并且在Hugging Face模型中心上公开可用,这是一个在线平台,人们可以轻松地协作并一起构建机器学习模型。

这些可以通过本地管道包装器或通过MlXPipeline类调用其托管的推理端点从LangChain调用。有关mlx的更多信息,请参见示例仓库笔记本。

要使用,您应该安装mlx-lm python ,以及transformers。您还可以安装huggingface_hub

%pip install --upgrade --quiet  mlx-lm transformers huggingface_hub

模型加载

可以通过使用from_model_id方法指定模型参数来加载模型。

from langchain_community.llms.mlx_pipeline import MLXPipeline

pipe = MLXPipeline.from_model_id(
"mlx-community/quantized-gemma-2b-it",
pipeline_kwargs={"max_tokens": 10, "temp": 0.1},
)
API Reference:MLXPipeline

它们也可以通过直接传入现有的transformers管道来加载

from mlx_lm import load

model, tokenizer = load("mlx-community/quantized-gemma-2b-it")
pipe = MLXPipeline(model=model, tokenizer=tokenizer)

创建链

将模型加载到内存后,您可以将其与提示组合以形成链。

from langchain_core.prompts import PromptTemplate

template = """Question: {question}

Answer: Let's think step by step."""
prompt = PromptTemplate.from_template(template)

chain = prompt | pipe

question = "What is electroencephalography?"

print(chain.invoke({"question": question}))
API Reference:PromptTemplate

这个页面有帮助吗?