Google 生成式 AI 嵌入

使用GoogleGenerativeAIEmbeddings类连接到Google的生成式AI嵌入服务，该类可在langchain-google-genai包中找到。

安装

%pip install --upgrade --quiet  langchain-google-genai

凭证

import getpass
import os

if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass("Provide your Google API key here")

用法

from langchain_google_genai import GoogleGenerativeAIEmbeddings

embeddings = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
vector = embeddings.embed_query("hello, world!")
vector[:5]

API Reference:GoogleGenerativeAIEmbeddings

[0.05636945, 0.0048285457, -0.0762591, -0.023642512, 0.05329321]

批次

你也可以一次性嵌入多个字符串以加快处理速度：

vectors = embeddings.embed_documents(
    [
        "Today is Monday",
        "Today is Tuesday",
        "Today is April Fools day",
    ]
)
len(vectors), len(vectors[0])

(3, 768)

任务类型

GoogleGenerativeAIEmbeddings 可选支持一个 task_type，目前必须是以下之一：

任务类型未指定
retrieval_query
检索文档
语义相似度
分类
聚类

默认情况下，我们在embed_documents方法中使用retrieval_document，在embed_query方法中使用retrieval_query。如果您提供了任务类型，我们将对所有方法使用该类型。

%pip install --upgrade --quiet  matplotlib scikit-learn

Note: you may need to restart the kernel to use updated packages.

query_embeddings = GoogleGenerativeAIEmbeddings(
    model="models/embedding-001", task_type="retrieval_query"
)
doc_embeddings = GoogleGenerativeAIEmbeddings(
    model="models/embedding-001", task_type="retrieval_document"
)

所有这些都将嵌入到'retrieval_query'任务集中

query_vecs = [query_embeddings.embed_query(q) for q in [query, query_2, answer_1]]

所有这些都将嵌入到'retrieval_document'任务集中

doc_vecs = [doc_embeddings.embed_query(q) for q in [query, query_2, answer_1]]

在检索中，相对距离很重要。在上图中，您可以看到“相关文档”和“相似查询”之间的相似性得分的差异，在后一种情况下，相似查询和相关文档之间的差异更大。

额外配置

您可以向ChatGoogleGenerativeAI传递以下参数以自定义SDK的行为：

client_options: 客户端选项传递给Google API客户端的选项，例如自定义的 client_options["api_endpoint"]
transport: 使用的传输方法，例如 rest, grpc, 或 grpc_asyncio.

嵌入模型概念指南
嵌入模型操作指南

安装​

凭证​

用法​

批次​

任务类型​

额外配置​

相关​

这个页面有帮助吗？

安装

凭证

用法

批次

任务类型

额外配置

相关