SambaStudioEmbeddings#

class langchain_community.embeddings.sambanova.SambaStudioEmbeddings[source]#

基础类:BaseModel, Embeddings

SambaNova嵌入模型。

要使用,您应该设置环境变量 SAMBASTUDIO_EMBEDDINGS_BASE_URL, SAMBASTUDIO_EMBEDDINGS_BASE_URI SAMBASTUDIO_EMBEDDINGS_PROJECT_ID, SAMBASTUDIO_EMBEDDINGS_ENDPOINT_ID, SAMBASTUDIO_EMBEDDINGS_API_KEY 使用您的个人sambastudio变量或将其作为命名参数传递给构造函数。

示例

from langchain_community.embeddings import SambaStudioEmbeddings

embeddings = SambaStudioEmbeddings(sambastudio_embeddings_base_url=base_url,
                              sambastudio_embeddings_base_uri=base_uri,
                              sambastudio_embeddings_project_id=project_id,
                              sambastudio_embeddings_endpoint_id=endpoint_id,
                              sambastudio_embeddings_api_key=api_key,
                              batch_size=32)
(or)

embeddings = SambaStudioEmbeddings(batch_size=32)

(or)

# CoE example
embeddings = SambaStudioEmbeddings(
    batch_size=1,
    model_kwargs={
        'select_expert':'e5-mistral-7b-instruct'
    }
)

通过解析和验证来自关键字参数的输入数据来创建一个新模型。

如果输入数据无法验证以形成有效模型,则引发 [ValidationError][pydantic_core.ValidationError]。

self 被显式地设为仅位置参数,以允许 self 作为字段名称。

param batch_size: int = 32#

嵌入模型的批量大小

param model_kwargs: dict = {}#

传递给模型的关键字参数。

param sambastudio_embeddings_api_key: str = ''#

sambastudio api 密钥

param sambastudio_embeddings_base_uri: str = ''#

端点基础URI

param sambastudio_embeddings_base_url: str = ''#

使用的基本URL

param sambastudio_embeddings_endpoint_id: str = ''#

sambastudio 上模型的端点 ID

param sambastudio_embeddings_project_id: str = ''#

模型在sambastudio上的项目ID

async aembed_documents(texts: list[str]) list[list[float]]#

异步嵌入搜索文档。

Parameters:

文本 (列表[字符串]) – 要嵌入的文本列表。

Returns:

嵌入列表。

Return type:

列表[列表[浮点数]]

async aembed_query(text: str) list[float]#

异步嵌入查询文本。

Parameters:

文本 (str) – 要嵌入的文本。

Returns:

嵌入。

Return type:

列表[浮点数]

embed_documents(texts: List[str], batch_size: int | None = None) List[List[float]][source]#

返回给定句子的嵌入列表。 :param texts: 要编码的文本列表 :type texts: List[str] :param batch_size: 编码的批量大小 :type batch_size: int

Returns:

给定句子的嵌入列表

Return type:

List[np.ndarray]List[tensor]

Parameters:
  • 文本 (列表[字符串])

  • batch_size (int | None)

embed_query(text: str) List[float][source]#

返回给定句子的嵌入列表。 :param sentences: 要编码的句子列表 :type sentences: List[str]

Returns:

给定句子的嵌入列表

Return type:

List[np.ndarray]List[tensor]

Parameters:

文本 (str)

classmethod validate_environment(values: Dict) Dict[source]#

验证环境中是否存在API密钥和Python包。

Parameters:

(字典)

Return type:

字典

使用 SambaStudioEmbeddings 的示例