向量存储
选择嵌入模型:
Select embeddings model:
pip install -qU langchain-openai
import getpass
import os
if not os.environ.get("OPENAI_API_KEY"):
os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
选择向量存储:
Select vector store:
pip install -qU langchain-core
from langchain_core.vectorstores import InMemoryVectorStore
vector_store = InMemoryVectorStore(embeddings)
向量存储 | 按ID删除 | 过滤 | 按向量搜索 | 带分数搜索 | 异步 | 通过标准测试 | 多租户 | 添加文档中的ID |
---|---|---|---|---|---|---|---|---|
AstraDBVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Chroma | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Clickhouse | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ |
CouchbaseVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
DatabricksVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
ElasticsearchStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
FAISS | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
InMemoryVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
Milvus | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
MongoDBAtlasVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
PGVector | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
PineconeVectorStore | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ |
QdrantVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Redis | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Weaviate | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ |
SQLServer | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
所有向量存储
名称 | 描述 |
---|---|
Activeloop Deep Lake | Activeloop Deep Lake 作为多模态向量存储,用于存储嵌入... |
Aerospike | Aerospike 向量搜索 (AVS) 是一个 |
Alibaba Cloud OpenSearch | 阿里云Opensearch是一个一站式平台,用于开发智能... |
AnalyticDB | AnalyticDB for PostgreSQL 是一个大规模并行处理(MPP)数据库... |
Annoy | Annoy (近似最近邻搜索) 是一个用 C++ 编写的库,具有 P... |
Apache Doris | Apache Doris 是一个用于实时分析的现代数据仓库。 |
ApertureDB | ApertureDB 是一个存储、索引和管理多模态数据的数据库... |
Astra DB Vector Store | 本页面提供了使用Astra DB作为向量存储的快速入门指南。 |
Atlas | Atlas 是由 Nomic 创建的一个平台,用于与小型和大型数据进行交互... |
AwaDB | AwaDB 是一个用于嵌入搜索和存储的 AI 原生数据库... |
Azure Cosmos DB Mongo vCore | 本笔记本展示了如何利用这个集成的向量数据库... |
Azure Cosmos DB No SQL | 此笔记本向您展示如何利用此集成向量数据库... |
Azure AI Search | Azure AI 搜索(以前称为 Azure 搜索和 Azure 认知搜索... |
Bagel | Bagel(AI的开放推理平台),就像AI数据的GitHub。 |
BagelDB | BagelDB(AI的开放向量数据库),就像AI数据的GitHub。 |
Baidu Cloud ElasticSearch VectorSearch | 百度云VectorSearch是一个完全托管的、企业级分布式... |
Baidu VectorDB | Baidu VectorDB 是一个强大的企业级分布式数据库服务... |
Apache Cassandra | 本页面提供了使用 Apache Cassandra® 作为 Vect... 的快速入门指南。 |
Chroma | 本笔记本介绍了如何开始使用Chroma向量存储。 |
Clarifai | Clarifai 是一个提供完整 AI 生命周期的 AI 平台... |
ClickHouse | ClickHouse 是最快且资源效率最高的开源数据库... |
Couchbase | Couchbase 是一个屡获殊荣的分布式 NoSQL 云数据库,它... |
DashVector | DashVector 是一个全托管的向量数据库服务,支持高维... |
Databricks | Databricks 向量搜索是一个无服务器的相似性搜索引擎... |
DingoDB | DingoDB 是一个分布式多模式向量数据库,它结合了... |
DocArray HnswSearch | DocArrayHnswSearch 是一个轻量级的文档索引实现... |
DocArray InMemorySearch | DocArrayInMemorySearch 是由 Docarray 提供的文档索引,它... |
Amazon Document DB | Amazon DocumentDB(与MongoDB兼容)使得设置变得容易... |
DuckDB | 本笔记本展示了如何使用DuckDB作为向量存储。 |
中国移动ECloud ElasticSearch向量搜索 | 中国移动ECloud向量搜索是一个完全托管的、企业级的... |
Elasticsearch | Elasticsearch 是一个分布式的、RESTful 风格的搜索和分析引擎,... |
Epsilla | Epsilla 是一个开源的向量数据库,利用先进的技术... |
Faiss | Facebook AI 相似性搜索 (FAISS) 是一个用于高效相似性搜索的库... |
Faiss (Async) | Facebook AI 相似性搜索 (Faiss) 是一个用于高效相似性搜索的库... |
FalkorDBVectorStore | FalkorDB 是一个开源的图数据库,集成了对...的支持 |
Google AlloyDB for PostgreSQL | AlloyDB 是一个完全托管的关系数据库服务,提供高... |
Google BigQuery Vector Search | Google Cloud BigQuery Vector Search 允许您使用 GoogleSQL 进行语义... |
Google Cloud SQL for MySQL | Cloud SQL 是一个完全托管的关系型数据库服务,提供 ... |
Google Cloud SQL for PostgreSQL | Cloud SQL 是一个完全托管的关系型数据库服务,提供 ... |
Firestore | Firestore 是一个无服务器的面向文档的数据库,可以扩展到... |
Google Memorystore for Redis | Google Memorystore for Redis 是一项完全托管的服务,提供强大的... |
Google Spanner | Spanner 是一个高度可扩展的数据库,结合了无限的可扩展性... |
Google Vertex AI Feature Store | Google Cloud Vertex 特征存储简化了您的机器学习特征管理... |
Google Vertex AI Vector Search | 本笔记本展示了如何使用与Google Cl...相关的功能 |
Hippo | Transwarp Hippo 是一个企业级云原生分布式向量... |
Hologres | Hologres 是由...开发的统一实时数据仓库服务 |
Infinispan | Infinispan 是一个开源键值数据网格,它可以作为单机... |
Jaguar Vector Database | 1. 它是一个分布式向量数据库 |
KDB.AI | KDB.AI 是一个强大的基于知识的向量数据库和搜索引擎... |
Kinetica | Kinetica 是一个集成了向量相似性支持的数据库... |
LanceDB | LanceDB 是一个开源的向量搜索数据库,构建于持久化... |
Lantern | Lantern 是一个用于 Postgres 的开源向量相似性搜索工具 |
LLMRails | LLMRails 是一个用于构建 GenAI 应用程序的 API 平台。它提供... |
ManticoreSearch VectorStore | ManticoreSearch 是一个开源的搜索引擎,提供快速、可扩展... |
Marqo | 本笔记本展示了如何使用与Marqo向量相关的功能... |
Meilisearch | Meilisearch 是一个开源、极速且高度相关的搜索引擎... |
Amazon MemoryDB | 向量搜索介绍及langchain集成指南。 |
Milvus | Milvus 是一个用于存储、索引和管理海量嵌入向量的数据库... |
Momento Vector Index (MVI) | MVI: 最高效、最易用、无服务器的向量索引... |
MongoDB Atlas | 本笔记本介绍了如何在LangChain中使用MongoDB Atlas向量搜索,... |
MyScale | MyScale 是一个基于云的数据库,专为AI应用优化... |
Neo4j Vector Index | Neo4j 是一个开源的图数据库,集成了对向量... |
NucliaDB | 您可以使用本地的NucliaDB实例或使用Nuclia云服务。 |
Oceanbase | 本笔记本介绍了如何开始使用Oceanbase向量存储... |
OpenSearch | OpenSearch 是一个可扩展、灵活且可扩展的开源软件... |
Oracle AI Vector Search: Vector Store | Oracle AI Vector Search 专为人工智能(AI)设计... |
Pathway | Pathway 是一个开放的数据处理框架。它允许您轻松地... |
Postgres Embedding | Postgres Embedding 是一个用于 Pos... 的开源向量相似性搜索 |
PGVecto.rs | 本笔记本展示了如何使用与Postgres相关的功能... |
PGVector | 使用postgres实现LangChain向量存储抽象... |
Pinecone | Pinecone 是一个具有广泛功能的向量数据库。 |
Qdrant | Qdrant(读作:quadrant)是一个向量相似性搜索引擎。它提供... |
Redis | 本笔记本介绍了如何开始使用Redis向量存储。 |
Relyt | Relyt 是一个云原生的数据仓库服务,旨在... |
Rockset | Rockset 是一个为实时搜索和分析构建的数据库... |
SAP HANA Cloud Vector Engine | SAP HANA Cloud Vector Engine 是一个完全集成到...的向量存储 |
ScaNN | ScaNN(可扩展最近邻)是一种高效的向量搜索方法... |
SemaDB | SemaDB 来自 SemaFind,是一个简单易用的向量相似性数据库,用于构建... |
SingleStoreDB | SingleStoreDB 是一个强大、高性能的分布式 SQL 数据库 ... |
scikit-learn | scikit-learn 是一个开源的机器学习算法集合... |
SQLiteVec | 本笔记本介绍了如何开始使用SQLiteVec向量存储... |
SQLite-VSS | SQLite-VSS 是一个为向量搜索设计的 SQLite 扩展,强调... |
SQLServer | Azure SQL 提供了一个专用的向量数据类型,简化了 c... |
StarRocks | StarRocks 是一个高性能的分析数据库。 |
Supabase (Postgres) | Supabase 是一个开源的 Firebase 替代品。Supabase 构建于... |
SurrealDB | SurrealDB 是一个为现代应用设计的端到端云原生数据库... |
Tablestore | Tablestore 是一个完全托管的 NoSQL 云数据库服务。 |
Tair | Tair 是阿里巴巴开发的云原生内存数据库服务... |
Tencent Cloud VectorDB | 腾讯云VectorDB是一个完全托管、自主研发的企业级... |
ThirdAI NeuralDB | NeuralDB 是由...开发的CPU友好且可微调的向量存储。 |
TiDB Vector | TiDB Cloud,是一个全面的数据库即服务(DBaaS)解决方案... |
Tigris | Tigris 是一个开源的 Serverless NoSQL 数据库和搜索平台... |
TileDB | TileDB 是一个强大的引擎,用于索引和查询密集和稀疏... |
Timescale Vector (Postgres) | Timescale Vector 是用于AI应用的PostgreSQL++向量数据库。 |
Typesense | Typesense 是一个开源的内存搜索引擎,你可以... |
Upstash Vector | Upstash Vector 是一个为处理...设计的无服务器向量数据库 |
USearch | USearch 是一个更小更快的单文件向量搜索引擎 |
Vald | Vald 是一个高度可扩展的分布式快速近似最近邻... |
Intel's Visual Data Management System (VDMS) | Intel的VDMS是一种用于高效访问大“视觉”数据的存储解决方案... |
Vearch | Vearch 是用于深度学习和人工智能的向量搜索基础设施... |
Vectara | Vectara 是值得信赖的 AI 助手和代理平台,专注于 ... |
Vespa | Vespa 是一个功能齐全的搜索引擎和向量数据库。它支持... |
viking DB | viking DB 是一个用于存储、索引和管理大规模嵌入的数据库... |
vlite | VLite 是一个简单且极快的向量数据库,允许您... |
Weaviate | 本笔记本介绍了如何开始使用Weaviate向量存储... |
Xata | Xata 是一个基于 PostgreSQL 的无服务器数据平台。它提供 ... |
Yellowbrick | Yellowbrick 是一个弹性的、大规模并行处理(MPP)SQL 数据库... |
Zep | 回忆、理解并从聊天记录中提取数据。增强个人... |
Zep Cloud | 从聊天记录中回忆、理解和提取数据。为个性化... |
Zilliz | Zilliz Cloud 是一个完全托管的云服务,用于 LF AI Milvus®, |