LaserEmbeddings#

class langchain_community.embeddings.laser.LaserEmbeddings[来源]#

基础类:BaseModel, Embeddings

LASER 语言无关的句子表示。 LASER 是由 Meta AI 研究团队开发的 Python 库, 用于为超过 147 种语言创建多语言句子嵌入, 截至 2024 年 2 月 25 日。 更多文档请参见: * facebookresearch/LASER * facebookresearch/LASER * https://arxiv.org/abs/2205.12654

要使用这个类,你必须安装laser_encoders Python包。

pip install laser_encoders .. rubric:: 示例

从激光编码器导入LaserEncoderPipeline 编码器 = LaserEncoderPipeline(lang=”eng_Latn”) 嵌入 = 编码器.encode_sentences([“Hello”, “World”])

通过解析和验证来自关键字参数的输入数据来创建一个新模型。

如果输入数据无法验证以形成有效模型,则引发 [ValidationError][pydantic_core.ValidationError]。

self 被显式地设为仅位置参数,以允许 self 作为字段名称。

param lang: str | None = None#

您希望使用的语言或语言代码 如果为空,此实现将默认使用多语言早期LASER编码器模型(称为laser2) 在facebookresearch/flores找到支持的语言列表

async aembed_documents(texts: list[str]) list[list[float]]#

异步嵌入搜索文档。

Parameters:

文本 (列表[字符串]) – 要嵌入的文本列表。

Returns:

嵌入列表。

Return type:

列表[列表[浮点数]]

async aembed_query(text: str) list[float]#

异步嵌入查询文本。

Parameters:

文本 (str) – 要嵌入的文本。

Returns:

嵌入。

Return type:

列表[浮点数]

embed_documents(texts: List[str]) List[List[float]][source]#

使用LASER为文档生成嵌入。

Parameters:

文本 (列表[字符串]) – 要嵌入的文本列表。

Returns:

嵌入列表,每个文本对应一个。

Return type:

列表[列表[float]]

embed_query(text: str) List[float][来源]#

使用LASER生成单个查询文本的嵌入。

Parameters:

文本 (str) – 要嵌入的文本。

Returns:

文本的嵌入。

Return type:

列表[float]

classmethod validate_environment(values: Dict) Dict[source]#

验证是否已安装 laser_encoders。

Parameters:

(字典)

Return type:

字典

使用 LaserEmbeddings 的示例