Skip to main content

ChatOllama

Ollama 允许您在本地运行开源大型语言模型,例如 Llama 2。

Ollama将模型权重、配置和数据捆绑到一个单一的包中,由 Modelfile 定义。

它优化了设置和配置细节,包括 GPU 使用。

要查看支持的模型和模型变体的完整列表,请参阅Ollama模型库

设置

首先,按照这些说明设置和运行本地的 Ollama 实例:

  • 下载并安装 Ollama 到可用的支持平台上(包括 Windows Subsystem for Linux)

  • 通过 ollama pull <name-of-model> 获取可用的 LLM 模型

    • 通过模型库查看可用模型的列表

    • 例如,ollama pull llama3

  • 这将下载模型的默认标记版本。通常,默认指向最新的、参数最小的模型。

在 Mac 上,模型将被下载到 ~/.ollama/models

在 Linux(或 WSL)上,模型将存储在 /usr/share/ollama/.ollama/models

  • 指定感兴趣的模型的确切版本,例如 ollama pull vicuna:13b-v1.5-16k-q4_0(在此示例中查看 Vicuna 模型的各种标记

  • 要查看所有已拉取的模型,使用 ollama list

  • 要直接从命令行与模型交谈,使用 ollama run <name-of-model>

  • 查看Ollama文档以获取更多命令。在终端中运行 ollama help 也可以查看可用命令。

使用

您可以在API 参考页面上查看支持的参数的完整列表。

如果您使用的是 LLaMA chat 模型(例如 ollama pull llama3),那么您可以使用 ChatOllama 接口。

这包括特殊标记用于系统消息和用户输入。

与模型交互

以下是与本地拉取的模型进行交互的几种方式

直接在终端中:

  • 所有本地模型都会自动在 localhost:11434 上提供服务

  • 运行 ollama run <name-of-model> 直接通过命令行开始交互

通过 API

向 Ollama 的 API 端点发送 application/json 请求以进行交互。

curl http://localhost:11434/api/generate -d '{
"model": "llama3",
"prompt":"Why is the sky blue?"
}'

查看所有端点的 Ollama API 文档

通过 LangChain

查看在 LangChain 应用程序中使用 ChatOllama 聊天模型的典型基本示例。

# LangChain 支持许多其他聊天模型。在这里,我们使用 Ollama
from langchain_community.chat_models import ChatOllama
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
# 支持许多其他可选参数。将鼠标悬停在您的 `ChatOllama(...)`
# 类上,以查看最新支持的参数
llm = ChatOllama(model="llama3")
prompt = ChatPromptTemplate.from_template("Tell me a short joke about {topic}")
# 使用 LangChain 表达式语言链语法
# 了解更多关于 LCEL 的信息
# /docs/expression_language/why
chain = prompt | llm | StrOutputParser()
# 为简洁起见,响应在终端中打印出来
# 您可以使用 LangServe 部署您的应用程序以供
# 生产使用
print(chain.invoke({"topic": "Space travel"}))
Why did the astronaut break up with his girlfriend?
Because he needed space!

LCEL 链,开箱即用,提供额外功能,如响应流式传输和异步支持

topic = {"topic": "Space travel"}
for chunks in chain.stream(topic):
print(chunks)
Why
did
the
astronaut
break
up
with
his
girlfriend
before
going
to
Mars
?
Because
he
needed
space
!

对于流式异步支持,以下是一个示例 - 这一切都可以通过上面创建的单个链来实现。

topic = {"topic": "Space travel"}
async for chunks in chain.astream(topic):
print(chunks)

查看LangChain Expressive Language (LCEL) Interface以了解创建链时可用的其他接口。

从源代码构建

要获取最新的从源代码构建说明,请查看 Ollama 文档中的从源代码构建

提取

使用最新版本的 Ollama 并提供 format 标志。format 标志将强制模型以 JSON 格式生成响应。

注意: 您也可以尝试使用实验性的 OllamaFunctions 包装器来方便地进行尝试。

from langchain_community.chat_models import ChatOllama
llm = ChatOllama(model="llama3", format="json", temperature=0)
from langchain_core.messages import HumanMessage
messages = [
HumanMessage(
content="白天不同时间天空的颜色是什么?使用 JSON 进行回复"
)
]
chat_model_response = llm.invoke(messages)
print(chat_model_response)
content='{ "morning": "blue", "noon": "clear blue", "afternoon": "hazy yellow", "evening": "orange-red" }\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n  \n\n\n\n\n\n ' id='run-e893700f-e2d0-4df8-ad86-17525dcee318-0'
import json
from langchain_community.chat_models import ChatOllama
from langchain_core.messages import HumanMessage
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
json_schema = {
"title": "Person",
"description": "关于一个人的身份信息。",
"type": "object",
"properties": {
"name": {"title": "姓名", "description": "人的姓名", "type": "string"},
"age": {"title": "年龄", "description": "人的年龄", "type": "integer"},
"fav_food": {
"title": "喜爱食物",
"description": "人喜爱的食物",
"type": "string",
},
},
"required": ["name", "age"],
}
llm = ChatOllama(model="llama2")
messages = [
HumanMessage(
content="请使用以下 JSON 模式告诉我一个人的信息:"
),
HumanMessage(content="{dumps}"),
HumanMessage(
content="现在,根据模式,告诉我一个名叫约翰(John)的人,他今年35岁,喜欢披萨。"
),
]
prompt = ChatPromptTemplate.from_messages(messages)
dumps = json.dumps(json_schema, indent=2)
chain = prompt | llm | StrOutputParser()
print(chain.invoke({"dumps": dumps}))
姓名: John
年龄: 35
喜欢: 披萨

多模态

Ollama 支持多模态 LLM,例如 bakllavallava

通过 tags 浏览带有模型的完整版本,例如 Llava

通过 ollama pull bakllava 下载所需的 LLM。

请确保更新 Ollama 以获取支持多模态的最新版本。

查看下面如何使用 ChatOllama 多模态支持的典型示例:

pip install --upgrade --quiet  pillow
注意:您可能需要重新启动内核以使用更新后的软件包。
import base64
from io import BytesIO
from IPython.display import HTML, display
from PIL import Image
def convert_to_base64(pil_image):
"""
将 PIL 图像转换为 Base64 编码的字符串
:param pil_image: PIL 图像
:return: 调整大小后的 Base64 字符串
"""
buffered = BytesIO()
pil_image.save(buffered, format="JPEG") # 如果需要,可以更改格式
img_str = base64.b64encode(buffered.getvalue()).decode("utf-8")
return img_str
def plt_img_base64(img_base64):
"""
将 Base64 编码的字符串显示为图像
:param img_base64: Base64 字符串
"""
# 使用 Base64 字符串创建 HTML 图像标记
image_html = f'<img src="data:image/jpeg;base64,{img_base64}" />'
# 通过渲染 HTML 来显示图像
display(HTML(image_html))
file_path = "../../../static/img/ollama_example_img.jpg"
pil_image = Image.open(file_path)
image_b64 = convert_to_base64(pil_image)
plt_img_base64(image_b64)
<img src="" /> 
from langchain_community.chat_models import ChatOllama
from langchain_core.messages import HumanMessage
llm = ChatOllama(model="bakllava", temperature=0)
def prompt_func(data):
text = data["text"]
image = data["image"]
image_part = {
"type": "image_url",
"image_url": f"data:image/jpeg;base64,{image}",
}
content_parts = []
text_part = {"type": "text", "text": text}
content_parts.append(image_part)
content_parts.append(text_part)
return [HumanMessage(content=content_parts)]
from langchain_core.output_parsers import StrOutputParser
chain = prompt_func | llm | StrOutputParser()
query_chain = chain.invoke(
{"text": "什么是基于美元的毛收入保留率?", "image": image_b64}
)
print(query_chain)
90%

Was this page helpful?


You can leave detailed feedback on GitHub.