FastEmbedSparse#
- class langchain_qdrant.fastembed_sparse.FastEmbedSparse(model_name: str = 'Qdrant/bm25', batch_size: int = 256, cache_dir: str | None = None, threads: int | None = None, providers: Sequence[Any] | None = None, parallel: int | None = None, **kwargs: Any)[source]#
一个用于与Qdrant一起使用的稀疏嵌入模型的接口。
使用FastEmbed实现的稀疏编码器 - https://qdrant.github.io/fastembed/ 有关可用模型的列表,请参阅 https://qdrant.github.io/fastembed/examples/Supported_Models/
- Parameters:
model_name (str) – 使用的模型名称。默认为 “Qdrant/bm25”。
batch_size (int) – 编码的批量大小。默认为256。
cache_dir (str, optional) – 模型缓存目录的路径。也可以通过FASTEMBED_CACHE_PATH环境变量设置。
threads (int, optional) – onnxruntime 会话可以使用的线程数。
providers (Sequence[Any], optional) – ONNX执行提供者的列表。 parallel (int, optional): 如果 >1,将使用数据并行编码,推荐用于大型数据集的编码。 如果 0,使用所有可用的核心。 如果 None,不使用数据并行处理, 而是使用默认的onnxruntime线程。 默认为 None。
kwargs (Any) – 传递给 fastembed.SparseTextEmbedding 的额外选项
parallel (int | None)
- Raises:
ValueError – 如果 SparseTextEmbedding 中不支持 model_name。
方法
__init__
([model_name, batch_size, ...])使用FastEmbed实现的稀疏编码器 - https://qdrant.github.io/fastembed/ 有关可用模型的列表,请参阅 https://qdrant.github.io/fastembed/examples/Supported_Models/
aembed_documents
(texts)异步嵌入搜索文档。
aembed_query
(text)异步嵌入查询文本。
embed_documents
(texts)嵌入搜索文档。
embed_query
(text)嵌入查询文本。
- __init__(model_name: str = 'Qdrant/bm25', batch_size: int = 256, cache_dir: str | None = None, threads: int | None = None, providers: Sequence[Any] | None = None, parallel: int | None = None, **kwargs: Any) None [source]#
使用FastEmbed实现的稀疏编码器 - https://qdrant.github.io/fastembed/ 有关可用模型的列表,请参阅 https://qdrant.github.io/fastembed/examples/Supported_Models/
- Parameters:
model_name (str) – 使用的模型名称。默认为 “Qdrant/bm25”。
batch_size (int) – 编码的批量大小。默认为256。
cache_dir (str, optional) – 模型缓存目录的路径。也可以通过FASTEMBED_CACHE_PATH环境变量设置。
threads (int, optional) – onnxruntime 会话可以使用的线程数。
providers (Sequence[Any], optional) – ONNX执行提供者的列表。 parallel (int, optional): 如果 >1,将使用数据并行编码,推荐用于大型数据集的编码。 如果 0,使用所有可用的核心。 如果 None,不使用数据并行处理, 而是使用默认的onnxruntime线程。 默认为 None。
kwargs (Any) – 传递给 fastembed.SparseTextEmbedding 的额外选项
parallel (int | None)
- Raises:
ValueError – 如果 SparseTextEmbedding 中不支持 model_name。
- Return type:
无
- async aembed_documents(texts: List[str]) List[SparseVector] #
异步嵌入搜索文档。
- Parameters:
文本 (列表[字符串])
- Return type:
列表[SparseVector]
- async aembed_query(text: str) SparseVector #
异步嵌入查询文本。
- Parameters:
文本 (str)
- Return type:
- embed_documents(texts: List[str]) List[SparseVector] [source]#
嵌入搜索文档。
- Parameters:
文本 (列表[字符串])
- Return type:
列表[SparseVector]
- embed_query(text: str) SparseVector [source]#
嵌入查询文本。
- Parameters:
文本 (str)
- Return type: