SagemakerEndpointEmbeddings#
- class langchain_community.embeddings.sagemaker_endpoint.SagemakerEndpointEmbeddings[来源]#
基础类:
BaseModel
,Embeddings
自定义Sagemaker推理端点。
要使用,您必须提供已部署的Sagemaker模型的端点名称及其部署的区域。
为了进行身份验证,AWS客户端使用以下方法自动加载凭据: https://boto3.amazonaws.com/v1/documentation/api/latest/guide/credentials.html
如果应该使用特定的凭证配置文件,您必须传递要使用的来自~/.aws/credentials文件的配置文件的名称。
确保使用的凭据/角色具有访问Sagemaker端点所需的策略。 参见: https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html
通过解析和验证来自关键字参数的输入数据来创建一个新模型。
如果输入数据无法验证以形成有效模型,则引发 [ValidationError][pydantic_core.ValidationError]。
self 被显式地设为仅位置参数,以允许 self 作为字段名称。
- param client: Any = None#
- param content_handler: EmbeddingsContentHandler [Required]#
内容处理类,提供输入和输出转换函数,以处理LLM和端点之间的格式。
- param credentials_profile_name: str | None = None#
配置文件在 ~/.aws/credentials 或 ~/.aws/config 文件中的名称,该文件指定了访问密钥或角色信息。 如果未指定,将使用默认的凭证配置文件,如果在 EC2 实例上,则使用来自 IMDS 的凭证。 参见:https://boto3.amazonaws.com/v1/documentation/api/latest/guide/credentials.html
- param endpoint_kwargs: Dict | None = None#
传递给invoke_endpoint函数的可选属性。请参阅`boto3`_文档以获取更多信息。 .. _boto3: <https://boto3.amazonaws.com/v1/documentation/api/latest/index.html>
- param endpoint_name: str = ''#
已部署的Sagemaker模型的端点名称。 在AWS区域内必须是唯一的。
- param model_kwargs: Dict | None = None#
传递给模型的关键字参数。
- param region_name: str = ''#
Sagemaker模型部署的AWS区域,例如us-west-2。
- async aembed_documents(texts: list[str]) list[list[float]] #
异步嵌入搜索文档。
- Parameters:
文本 (列表[字符串]) – 要嵌入的文本列表。
- Returns:
嵌入列表。
- Return type:
列表[列表[浮点数]]
- async aembed_query(text: str) list[float] #
异步嵌入查询文本。
- Parameters:
文本 (str) – 要嵌入的文本。
- Returns:
嵌入。
- Return type:
列表[浮点数]
- embed_documents(texts: List[str], chunk_size: int = 64) List[List[float]] [source]#
使用SageMaker推理端点计算文档嵌入。
- Parameters:
texts (List[str]) – 要嵌入的文本列表。
chunk_size (int) – 块大小定义了将多少输入文本分组为一个请求。如果为None,将使用类指定的块大小。
- Returns:
嵌入列表,每个文本对应一个。
- Return type:
列表[列表[float]]
使用 SagemakerEndpointEmbeddings 的示例