Skip to main content

OpenAI

让我们加载 OpenAI Embedding 类。

设置

首先我们安装 langchain-openai 并设置所需的环境变量

%pip install -qU langchain-openai
import getpass
import os
os.environ["OPENAI_API_KEY"] = getpass.getpass()
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
text = "This is a test document."

用法

嵌入查询

query_result = embeddings.embed_query(text)
警告:未找到模型。使用 cl100k_base 编码。
query_result[:5]
[-0.014380056377383358,
-0.027191711627651764,
-0.020042716111860304,
0.057301379620345545,
-0.022267658631828974]

嵌入文档

doc_result = embeddings.embed_documents([text])
警告:未找到模型。使用 cl100k_base 编码。
doc_result[0][:5]
[-0.014380056377383358,
-0.027191711627651764,
-0.020042716111860304,
0.057301379620345545,
-0.022267658631828974]

指定维度

使用 text-embedding-3 类模型,您可以指定要返回的嵌入的大小。例如,默认情况下 text-embedding-3-large 返回维度为 3072 的嵌入:

len(doc_result[0])
3072

但是通过传入 dimensions=1024,我们可以将嵌入的大小减小到 1024:

embeddings_1024 = OpenAIEmbeddings(model="text-embedding-3-large", dimensions=1024)
len(embeddings_1024.embed_documents([text])[0])
警告:未找到模型。使用 cl100k_base 编码。
1024

Was this page helpful?


You can leave detailed feedback on GitHub.