vectorstores#

向量存储 存储嵌入数据并执行向量搜索。

存储和搜索非结构化数据的最常见方法之一是将其嵌入并存储生成的嵌入向量,然后查询存储并检索与嵌入查询“最相似”的数据。

类层次结构:

VectorStore --> <name>  # Examples: Annoy, FAISS, Milvus

BaseRetriever --> VectorStoreRetriever --> <name>Retriever  # Example: VespaRetriever

主要助手:

Embeddings, Document

vectorstores.aerospike.Aerospike(client, ...)

Aerospike 向量存储。

vectorstores.alibabacloud_opensearch.AlibabaCloudOpenSearch(...)

Alibaba Cloud OpenSearch 向量存储。

vectorstores.alibabacloud_opensearch.AlibabaCloudOpenSearchSettings(...)

阿里云Opensearch客户端配置。

vectorstores.analyticdb.AnalyticDB(...[, ...])

AnalyticDB (分布式 PostgreSQL) 向量存储。

vectorstores.annoy.Annoy(embedding_function, ...)

Annoy 向量存储。

vectorstores.apache_doris.ApacheDoris(...[, ...])

Apache Doris 向量存储。

vectorstores.apache_doris.ApacheDorisSettings

Apache Doris 客户端配置。

vectorstores.aperturedb.ApertureDB(embeddings)

创建一个由ApertureDB支持的向量存储

vectorstores.atlas.AtlasDB(name[, ...])

Atlas 向量存储。

vectorstores.awadb.AwaDB([table_name, ...])

AwaDB 向量存储。

vectorstores.azure_cosmos_db.AzureCosmosDBVectorSearch(...)

Azure Cosmos DB for MongoDB vCore 向量存储。

vectorstores.azure_cosmos_db.CosmosDBSimilarityType(value)

Cosmos DB 相似度类型作为枚举器。

vectorstores.azure_cosmos_db.CosmosDBVectorSearchType(value)

Cosmos DB 向量搜索类型作为枚举器。

vectorstores.azure_cosmos_db_no_sql.AzureCosmosDBNoSqlVectorSearch(*, ...)

Azure Cosmos DB for NoSQL 向量存储。

vectorstores.azure_cosmos_db_no_sql.Condition

通过解析和验证来自关键字参数的输入数据来创建一个新模型。

vectorstores.azure_cosmos_db_no_sql.CosmosDBQueryType(value)

CosmosDB 查询类型

vectorstores.azure_cosmos_db_no_sql.PreFilter

通过解析和验证来自关键字参数的输入数据来创建一个新模型。

vectorstores.azuresearch.AzureSearch(...[, ...])

Azure Cognitive Search 向量存储。

vectorstores.azuresearch.AzureSearchVectorStoreRetriever

使用Azure Cognitive Search的检索器。

vectorstores.bagel.Bagel([cluster_name, ...])

Bagel.net 推理平台。

vectorstores.baiducloud_vector_search.BESVectorStore(...)

百度Elasticsearch 向量存储。

vectorstores.baiduvectordb.BaiduVectorDB(...)

百度 VectorDB 作为向量存储。

vectorstores.baiduvectordb.ConnectionParams(...)

百度 VectorDB 连接参数。

vectorstores.baiduvectordb.TableParams(dimension)

百度 VectorDB 表参数。

vectorstores.cassandra.Cassandra(embedding)

用于向量存储工作负载的Apache Cassandra(R)。

vectorstores.clarifai.Clarifai([user_id, ...])

Clarifai AI 向量存储。

vectorstores.clickhouse.Clickhouse(embedding)

ClickHouse 向量存储集成。

vectorstores.clickhouse.ClickhouseSettings

ClickHouse 客户端配置。

vectorstores.dashvector.DashVector(...)

DashVector 向量存储。

vectorstores.deeplake.DeepLake([...])

Activeloop Deep Lake 向量存储。

vectorstores.dingo.Dingo(embedding, text_key, *)

Dingo 向量存储。

vectorstores.docarray.base.DocArrayIndex(...)

DocArray 基于向量存储的基类。

vectorstores.docarray.hnsw.DocArrayHnswSearch(...)

HnswLib 存储使用 DocArray 包。

vectorstores.docarray.in_memory.DocArrayInMemorySearch(...)

用于精确搜索的内存中的DocArray存储。

vectorstores.documentdb.DocumentDBSimilarityType(value)

DocumentDB 相似度类型作为枚举器。

vectorstores.documentdb.DocumentDBVectorSearch(...)

Amazon DocumentDB (与MongoDB兼容) 向量存储。

vectorstores.duckdb.DuckDB(*[, connection, ...])

DuckDB 向量存储。

vectorstores.ecloud_vector_search.EcloudESVectorStore(...)

ecloud Elasticsearch 向量存储。

vectorstores.elasticsearch.BaseRetrievalStrategy()

Elasticsearch 检索策略的基类。

vectorstores.epsilla.Epsilla(client, embeddings)

Epsilla 向量数据库的封装。

vectorstores.faiss.FAISS(embedding_function, ...)

FAISS 向量存储集成。

vectorstores.falkordb_vector.FalkorDBVector(...)

FalkorDB 向量索引。

vectorstores.falkordb_vector.IndexType(value)

索引类型的枚举器。

vectorstores.falkordb_vector.SearchType(value)

用于FalkorDB VectorStore中不同搜索策略的枚举器。

vectorstores.hanavector.HanaDB(connection, ...)

SAP HANA 云向量引擎

vectorstores.hippo.Hippo(embedding_function)

Hippo 向量存储。

vectorstores.hologres.Hologres(...[, ndims, ...])

Hologres API 向量存储。

vectorstores.infinispanvs.Infinispan([...])

Infinispan REST 接口的辅助类。

vectorstores.infinispanvs.InfinispanVS([...])

Infinispan 向量存储接口。

vectorstores.jaguar.Jaguar(pod, store, ...)

Jaguar API 向量存储。

vectorstores.kdbai.KDBAI(table, embedding[, ...])

KDB.AI 向量存储。

vectorstores.kinetica.Dimension(value[, ...])

一些已知嵌入的默认维度。

vectorstores.kinetica.DistanceStrategy(value)

距离策略的枚举器。

vectorstores.kinetica.Kinetica(config, ...)

Kinetica 向量存储。

vectorstores.kinetica.KineticaSettings

Kinetica 客户端配置。

vectorstores.lancedb.LanceDB([connection, ...])

LanceDB 向量存储。

vectorstores.lantern.BaseEmbeddingStore()

Lantern 嵌入存储的基类。

vectorstores.lantern.DistanceStrategy(value)

距离策略的枚举器。

vectorstores.lantern.Lantern(...[, ...])

Postgres 使用 lantern 扩展作为向量存储。

vectorstores.lantern.QueryResult()

查询结果。

vectorstores.llm_rails.LLMRails([...])

使用LLMRails实现的向量存储。

vectorstores.llm_rails.LLMRailsRetriever

LLMRails的检索器。

vectorstores.manticore_search.ManticoreSearch(...)

ManticoreSearch 引擎 向量存储。

vectorstores.manticore_search.ManticoreSearchSettings

通过解析和验证来自关键字参数的输入数据来创建一个新模型。

vectorstores.marqo.Marqo(client, index_name)

Marqo 向量存储。

vectorstores.meilisearch.Meilisearch(embedding)

Meilisearch 向量存储。

vectorstores.momento_vector_index.MomentoVectorIndex(...)

Momento Vector Index (MVI) 向量存储。

vectorstores.myscale.MyScale(embedding[, config])

MyScale 向量存储。

vectorstores.myscale.MyScaleSettings

MyScale 客户端配置。

vectorstores.myscale.MyScaleWithoutJSON(...)

没有元数据列的MyScale向量存储

vectorstores.nucliadb.NucliaDB(...[, ...])

NucliaDB 向量存储。

vectorstores.opensearch_vector_search.OpenSearchVectorSearch(...)

Amazon OpenSearch 向量引擎 向量存储。

vectorstores.oraclevs.OracleVS(client, ...)

OracleVS 向量存储。

vectorstores.pathway.PathwayVectorClient([...])

连接到Pathway向量存储的VectorStore。

vectorstores.pgembedding.BaseModel(**kwargs)

所有SQL存储的基础模型。

vectorstores.pgembedding.CollectionStore(...)

集合存储。

vectorstores.pgembedding.EmbeddingStore(**kwargs)

嵌入存储。

vectorstores.pgembedding.PGEmbedding(...[, ...])

Postgres 使用 pg_embedding 扩展作为向量存储。

vectorstores.pgembedding.QueryResult()

查询结果。

vectorstores.pgvecto_rs.PGVecto_rs(...[, ...])

由pgvecto_rs支持的VectorStore。

vectorstores.pgvector.BaseModel(**kwargs)

SQL存储的基础模型。

vectorstores.pgvector.DistanceStrategy(value)

距离策略的枚举器。

vectorstores.qdrant.QdrantException

Qdrant 相关的异常。

vectorstores.redis.base.RedisVectorStoreRetriever

用于 Redis VectorStore 的检索器。

vectorstores.redis.filters.RedisFilter()

RedisFilterFields 的集合。

vectorstores.redis.filters.RedisFilterExpression([...])

RedisFilterFields的逻辑表达式。

vectorstores.redis.filters.RedisFilterField(field)

RedisFilterFields 的基类。

vectorstores.redis.filters.RedisFilterOperator(value)

RedisFilterOperator 枚举器用于创建 RedisFilterExpressions。

vectorstores.redis.filters.RedisNum(field)

表示Redis索引中数字字段的RedisFilterField。

vectorstores.redis.filters.RedisTag(field)

表示Redis索引中标签的RedisFilterField。

vectorstores.redis.filters.RedisText(field)

RedisFilterField 表示 Redis 索引中的文本字段。

vectorstores.redis.schema.FlatVectorField

Redis中平面向量字段的模式。

vectorstores.redis.schema.HNSWVectorField

Redis中HNSW向量字段的模式。

vectorstores.redis.schema.NumericFieldSchema

Redis中数字字段的模式。

vectorstores.redis.schema.RedisDistanceMetric(value)

Redis向量字段的距离度量。

vectorstores.redis.schema.RedisField

Redis字段的基类。

vectorstores.redis.schema.RedisModel

Redis索引的架构。

vectorstores.redis.schema.RedisVectorField

Redis 向量字段的基类。

vectorstores.redis.schema.TagFieldSchema

Redis中标签字段的模式。

vectorstores.redis.schema.TextFieldSchema

Redis中文本字段的模式。

vectorstores.relyt.Relyt(connection_string, ...)

Relyt (分布式 PostgreSQL) 向量存储。

vectorstores.rocksetdb.Rockset(client, ...)

Rockset 向量存储。

vectorstores.scann.ScaNN(embedding, index, ...)

ScaNN 向量存储。

vectorstores.semadb.SemaDB(collection_name, ...)

SemaDB 向量存储。

vectorstores.singlestoredb.SingleStoreDB(...)

SingleStore DB 向量存储。

vectorstores.sklearn.BaseSerializer(persist_path)

用于序列化数据的基类。

vectorstores.sklearn.BsonSerializer(persist_path)

使用bson python包将数据序列化为二进制JSON。

vectorstores.sklearn.JsonSerializer(persist_path)

使用Python标准库中的json包将数据序列化为JSON格式。

vectorstores.sklearn.ParquetSerializer(...)

使用pyarrow包将数据序列化为Apache Parquet格式。

vectorstores.sklearn.SKLearnVectorStore(...)

基于scikit-learnNearestNeighbors的简单内存向量存储。

vectorstores.sklearn.SKLearnVectorStoreException

由SKLearnVectorStore引发的异常。

vectorstores.sqlitevec.SQLiteVec(table, ...)

使用Vec扩展的SQLite作为向量数据库。

vectorstores.sqlitevss.SQLiteVSS(table, ...)

使用VSS扩展的SQLite作为向量数据库。

vectorstores.starrocks.StarRocks(embedding)

StarRocks 向量存储。

vectorstores.starrocks.StarRocksSettings

StarRocks 客户端配置。

vectorstores.supabase.SupabaseVectorStore(...)

Supabase Postgres 向量存储。

vectorstores.surrealdb.SurrealDBStore(...)

SurrealDB 作为向量存储。

vectorstores.tablestore.TablestoreVectorStore(...)

Tablestore 向量存储。

vectorstores.tair.Tair(embedding_function, ...)

Tair 向量存储。

vectorstores.tencentvectordb.ConnectionParams(...)

腾讯向量数据库连接参数。

vectorstores.tencentvectordb.IndexParams(...)

腾讯向量数据库索引参数。

vectorstores.tencentvectordb.MetaField

腾讯向量数据库的元数据字段。

vectorstores.tencentvectordb.TencentVectorDB(...)

腾讯 VectorDB 作为向量存储。

vectorstores.thirdai_neuraldb.NeuralDBClientVectorStore(db)

使用ThirdAI的NeuralDB企业版Python客户端进行NeuralDBs的向量存储。

vectorstores.thirdai_neuraldb.NeuralDBVectorStore(db)

使用ThirdAI的NeuralDB的向量存储。

vectorstores.tidb_vector.TiDBVectorStore(...)

TiDB 向量存储。

vectorstores.tigris.Tigris(client, ...)

Tigris 向量存储。

vectorstores.tiledb.TileDB(embedding, ...[, ...])

TileDB 向量存储。

vectorstores.timescalevector.TimescaleVector(...)

Timescale Postgres 向量存储

vectorstores.typesense.Typesense(...[, ...])

Typesense 向量存储。

vectorstores.upstash.UpstashVectorStore([...])

Upstash 向量存储

vectorstores.usearch.USearch(embedding, ...)

USearch 向量存储。

vectorstores.utils.DistanceStrategy(value[, ...])

用于计算向量之间距离的距离策略的枚举器。

vectorstores.vald.Vald(embedding[, host, ...])

Vald 向量数据库。

vectorstores.vdms.VDMS(client, *[, ...])

英特尔实验室的VDMS用于向量存储工作负载。

vectorstores.vearch.Vearch(embedding_function)

初始化 vearch 向量存储标志 1 表示集群,0 表示独立

vectorstores.vectara.MMRConfig([is_enabled, ...])

最大边际相关性(MMR)搜索的配置。

vectorstores.vectara.RerankConfig([...])

重新排序器的配置。

vectorstores.vectara.SummaryConfig([...])

摘要生成的配置。

vectorstores.vectara.Vectara([...])

Vectara API 向量存储。

vectorstores.vectara.VectaraQueryConfig([k, ...])

Vectara查询的配置。

vectorstores.vectara.VectaraRAG(vectara, config)

Vectara RAG 可运行对象。

vectorstores.vectara.VectaraRetriever

Vectara 检索器类。

vectorstores.vespa.VespaStore(app[, ...])

Vespa 向量存储。

vectorstores.vikingdb.VikingDB(...[, ...])

vikingdb 作为向量存储

vectorstores.vikingdb.VikingDBConfig([host, ...])

vikingdb 连接配置

vectorstores.vlite.VLite(embedding_function)

VLite 是一个简单且快速的向量数据库,用于语义搜索。

vectorstores.weaviate.Weaviate(client, ...)

Weaviate 向量存储。

vectorstores.xata.XataVectorStore(api_key, ...)

Xata 向量存储。

vectorstores.yellowbrick.Yellowbrick(...[, ...])

Yellowbrick 作为向量数据库。

vectorstores.zep.CollectionConfig(name, ...)

Zep Collection的配置。

vectorstores.zep.ZepVectorStore(...[, ...])

Zep 向量存储。

vectorstores.zep_cloud.ZepCloudVectorStore(...)

Zep 向量存储。

vectorstores.zilliz.Zilliz(embedding_function)

Zilliz 向量存储。

函数

vectorstores.alibabacloud_opensearch.create_metadata(fields)

从字段创建元数据。

vectorstores.annoy.dependable_annoy_import()

如果可用则导入annoy,否则抛出错误。

vectorstores.clickhouse.has_mul_sub_str(s, *args)

检查字符串是否包含多个子字符串。

vectorstores.faiss.dependable_faiss_import([...])

如果可用则导入faiss,否则抛出错误。

vectorstores.falkordb_vector.construct_metadata_filter([...])

通过直接将过滤值注入查询来构建元数据过滤器。

vectorstores.falkordb_vector.dict_to_yaml_str(...)

将字典转换为类似YAML的字符串,而不使用外部库。

vectorstores.falkordb_vector.generate_random_string(length)

vectorstores.falkordb_vector.process_index_data(data)

处理嵌套的实体数据列表,以提取有关标签、实体类型、属性、索引类型和索引详细信息(如果适用)的信息。

vectorstores.lancedb.import_lancedb()

导入 lancedb 包。

vectorstores.lancedb.to_lance_filter(filter)

将字典过滤器转换为LanceDB过滤器字符串。

vectorstores.lantern.get_embedding_store(...)

获取嵌入存储类。

vectorstores.myscale.has_mul_sub_str(s, *args)

检查字符串是否包含多个子字符串。

vectorstores.oraclevs.create_index(client, ...)

在向量存储上创建索引。

vectorstores.oraclevs.drop_index_if_exists(...)

如果存在索引,则删除它。

vectorstores.oraclevs.drop_table_purge(...)

删除表并将其从数据库中清除。

vectorstores.qdrant.sync_call_fallback(method)

如果异步方法未实现,则调用类的同步方法的装饰器。

vectorstores.redis.base.check_index_exists(...)

检查Redis索引是否存在。

vectorstores.redis.filters.check_operator_misuse(func)

用于检查等式运算符滥用的装饰器。

vectorstores.redis.schema.read_schema(...)

从字典或yaml文件中读取索引模式。

vectorstores.scann.dependable_scann_import()

如果可用则导入scann,否则抛出错误。

vectorstores.scann.normalize(x)

将向量归一化为单位长度。

vectorstores.sqlitevec.serialize_f32(vector)

将浮点数列表序列化为紧凑的“原始字节”格式

vectorstores.starrocks.debug_output(s)

如果DEBUG为True,则打印调试信息。

vectorstores.starrocks.get_named_result(...)

从查询中获取一个命名结果。

vectorstores.starrocks.has_mul_sub_str(s, *args)

检查字符串是否包含多个子字符串。

vectorstores.tencentvectordb.translate_filter(...)

将LangChain过滤器转换为腾讯VectorDB过滤器。

vectorstores.tiledb.dependable_tiledb_import()

如果可用,导入tiledb-vector-search,否则抛出错误。

vectorstores.tiledb.get_documents_array_uri(uri)

获取文档数组的URI。

vectorstores.tiledb.get_documents_array_uri_from_group(group)

从组中获取文档数组的URI。

vectorstores.tiledb.get_vector_index_uri(uri)

获取向量索引的URI。

vectorstores.tiledb.get_vector_index_uri_from_group(group)

获取向量索引的URI。

vectorstores.usearch.dependable_usearch_import()

如果可用则导入usearch,否则抛出错误。

vectorstores.utils.filter_complex_metadata(...)

过滤掉向量存储不支持的元数据类型。

vectorstores.utils.maximal_marginal_relevance(...)

计算最大边际相关性。

vectorstores.vdms.VDMS_Client([host, port])

VDMS服务器的VDMS客户端。

vectorstores.vdms.embedding2bytes(embedding)

将嵌入转换为字节。

已弃用的类

已弃用的函数