向量存储
选择嵌入模型:
Select embeddings model:
pip install -qU langchain-openai
import getpass
import os
if not os.environ.get("OPENAI_API_KEY"):
os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
选择向量存储:
Select vector store:
pip install -qU langchain-core
from langchain_core.vectorstores import InMemoryVectorStore
vector_store = InMemoryVectorStore(embeddings)
| 向量存储 | 按ID删除 | 过滤 | 按向量搜索 | 带分数搜索 | 异步 | 通过标准测试 | 多租户 | 添加文档中的ID |
|---|---|---|---|---|---|---|---|---|
| AstraDBVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| Chroma | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| Clickhouse | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ |
| CouchbaseVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
| DatabricksVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| ElasticsearchStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| FAISS | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| InMemoryVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
| Milvus | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
| MongoDBAtlasVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| PGVector | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| PineconeVectorStore | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ |
| QdrantVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| Redis | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| Weaviate | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ |
| SQLServer | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
所有向量存储
| 名称 | 描述 |
|---|---|
| Activeloop Deep Lake | Activeloop Deep Lake 作为多模态向量存储,用于存储嵌入... |
| Aerospike | Aerospike 向量搜索 (AVS) 是一个 |
| Alibaba Cloud OpenSearch | 阿里云Opensearch是一个一站式平台,用于开发智能... |
| AnalyticDB | AnalyticDB for PostgreSQL 是一个大规模并行处理(MPP)数据库... |
| Annoy | Annoy (近似最近邻搜索) 是一个用 C++ 编写的库,具有 P... |
| Apache Doris | Apache Doris 是一个用于实时分析的现代数据仓库。 |
| ApertureDB | ApertureDB 是一个存储、索引和管理多模态数据的数据库... |
| Astra DB Vector Store | 本页面提供了使用Astra DB作为向量存储的快速入门指南。 |
| Atlas | Atlas 是由 Nomic 创建的一个平台,用于与小型和大型数据进行交互... |
| AwaDB | AwaDB 是一个用于嵌入搜索和存储的 AI 原生数据库... |
| Azure Cosmos DB Mongo vCore | 本笔记本展示了如何利用这个集成的向量数据库... |
| Azure Cosmos DB No SQL | 此笔记本向您展示如何利用此集成向量数据库... |
| Azure AI Search | Azure AI 搜索(以前称为 Azure 搜索和 Azure 认知搜索... |
| Bagel | Bagel(AI的开放推理平台),就像AI数据的GitHub。 |
| BagelDB | BagelDB(AI的开放向量数据库),就像AI数据的GitHub。 |
| Baidu Cloud ElasticSearch VectorSearch | 百度云VectorSearch是一个完全托管的、企业级分布式... |
| Baidu VectorDB | Baidu VectorDB 是一个强大的企业级分布式数据库服务... |
| Apache Cassandra | 本页面提供了使用 Apache Cassandra® 作为 Vect... 的快速入门指南。 |
| Chroma | 本笔记本介绍了如何开始使用Chroma向量存储。 |
| Clarifai | Clarifai 是一个提供完整 AI 生命周期的 AI 平台... |
| ClickHouse | ClickHouse 是最快且资源效率最高的开源数据库... |
| Couchbase | Couchbase 是一个屡获殊荣的分布式 NoSQL 云数据库,它... |
| DashVector | DashVector 是一个全托管的向量数据库服务,支持高维... |
| Databricks | Databricks 向量搜索是一个无服务器的相似性搜索引擎... |
| DingoDB | DingoDB 是一个分布式多模式向量数据库,它结合了... |
| DocArray HnswSearch | DocArrayHnswSearch 是一个轻量级的文档索引实现... |
| DocArray InMemorySearch | DocArrayInMemorySearch 是由 Docarray 提供的文档索引,它... |
| Amazon Document DB | Amazon DocumentDB(与MongoDB兼容)使得设置变得容易... |
| DuckDB | 本笔记本展示了如何使用DuckDB作为向量存储。 |
| 中国移动ECloud ElasticSearch向量搜索 | 中国移动ECloud向量搜索是一个完全托管的、企业级的... |
| Elasticsearch | Elasticsearch 是一个分布式的、RESTful 风格的搜索和分析引擎,... |
| Epsilla | Epsilla 是一个开源的向量数据库,利用先进的技术... |
| Faiss | Facebook AI 相似性搜索 (FAISS) 是一个用于高效相似性搜索的库... |
| Faiss (Async) | Facebook AI 相似性搜索 (Faiss) 是一个用于高效相似性搜索的库... |
| FalkorDBVectorStore | FalkorDB 是一个开源的图数据库,集成了对...的支持 |
| Google AlloyDB for PostgreSQL | AlloyDB 是一个完全托管的关系数据库服务,提供高... |
| Google BigQuery Vector Search | Google Cloud BigQuery Vector Search 允许您使用 GoogleSQL 进行语义... |
| Google Cloud SQL for MySQL | Cloud SQL 是一个完全托管的关系型数据库服务,提供 ... |
| Google Cloud SQL for PostgreSQL | Cloud SQL 是一个完全托管的关系型数据库服务,提供 ... |
| Firestore | Firestore 是一个无服务器的面向文档的数据库,可以扩展到... |
| Google Memorystore for Redis | Google Memorystore for Redis 是一项完全托管的服务,提供强大的... |
| Google Spanner | Spanner 是一个高度可扩展的数据库,结合了无限的可扩展性... |
| Google Vertex AI Feature Store | Google Cloud Vertex 特征存储简化了您的机器学习特征管理... |
| Google Vertex AI Vector Search | 本笔记本展示了如何使用与Google Cl...相关的功能 |
| Hippo | Transwarp Hippo 是一个企业级云原生分布式向量... |
| Hologres | Hologres 是由...开发的统一实时数据仓库服务 |
| Infinispan | Infinispan 是一个开源键值数据网格,它可以作为单机... |
| Jaguar Vector Database | 1. 它是一个分布式向量数据库 |
| KDB.AI | KDB.AI 是一个强大的基于知识的向量数据库和搜索引擎... |
| Kinetica | Kinetica 是一个集成了向量相似性支持的数据库... |
| LanceDB | LanceDB 是一个开源的向量搜索数据库,构建于持久化... |
| Lantern | Lantern 是一个用于 Postgres 的开源向量相似性搜索工具 |
| LLMRails | LLMRails 是一个用于构建 GenAI 应用程序的 API 平台。它提供... |
| ManticoreSearch VectorStore | ManticoreSearch 是一个开源的搜索引擎,提供快速、可扩展... |
| Marqo | 本笔记本展示了如何使用与Marqo向量相关的功能... |
| Meilisearch | Meilisearch 是一个开源、极速且高度相关的搜索引擎... |
| Amazon MemoryDB | 向量搜索介绍及langchain集成指南。 |
| Milvus | Milvus 是一个用于存储、索引和管理海量嵌入向量的数据库... |
| Momento Vector Index (MVI) | MVI: 最高效、最易用、无服务器的向量索引... |
| MongoDB Atlas | 本笔记本介绍了如何在LangChain中使用MongoDB Atlas向量搜索,... |
| MyScale | MyScale 是一个基于云的数据库,专为AI应用优化... |
| Neo4j Vector Index | Neo4j 是一个开源的图数据库,集成了对向量... |
| NucliaDB | 您可以使用本地的NucliaDB实例或使用Nuclia云服务。 |
| Oceanbase | 本笔记本介绍了如何开始使用Oceanbase向量存储... |
| OpenSearch | OpenSearch 是一个可扩展、灵活且可扩展的开源软件... |
| Oracle AI Vector Search: Vector Store | Oracle AI Vector Search 专为人工智能(AI)设计... |
| Pathway | Pathway 是一个开放的数据处理框架。它允许您轻松地... |
| Postgres Embedding | Postgres Embedding 是一个用于 Pos... 的开源向量相似性搜索 |
| PGVecto.rs | 本笔记本展示了如何使用与Postgres相关的功能... |
| PGVector | 使用postgres实现LangChain向量存储抽象... |
| Pinecone | Pinecone 是一个具有广泛功能的向量数据库。 |
| Qdrant | Qdrant(读作:quadrant)是一个向量相似性搜索引擎。它提供... |
| Redis | 本笔记本介绍了如何开始使用Redis向量存储。 |
| Relyt | Relyt 是一个云原生的数据仓库服务,旨在... |
| Rockset | Rockset 是一个为实时搜索和分析构建的数据库... |
| SAP HANA Cloud Vector Engine | SAP HANA Cloud Vector Engine 是一个完全集成到...的向量存储 |
| ScaNN | ScaNN(可扩展最近邻)是一种高效的向量搜索方法... |
| SemaDB | SemaDB 来自 SemaFind,是一个简单易用的向量相似性数据库,用于构建... |
| SingleStoreDB | SingleStoreDB 是一个强大、高性能的分布式 SQL 数据库 ... |
| scikit-learn | scikit-learn 是一个开源的机器学习算法集合... |
| SQLiteVec | 本笔记本介绍了如何开始使用SQLiteVec向量存储... |
| SQLite-VSS | SQLite-VSS 是一个为向量搜索设计的 SQLite 扩展,强调... |
| SQLServer | Azure SQL 提供了一个专用的向量数据类型,简化了 c... |
| StarRocks | StarRocks 是一个高性能的分析数据库。 |
| Supabase (Postgres) | Supabase 是一个开源的 Firebase 替代品。Supabase 构建于... |
| SurrealDB | SurrealDB 是一个为现代应用设计的端到端云原生数据库... |
| Tablestore | Tablestore 是一个完全托管的 NoSQL 云数据库服务。 |
| Tair | Tair 是阿里巴巴开发的云原生内存数据库服务... |
| Tencent Cloud VectorDB | 腾讯云VectorDB是一个完全托管、自主研发的企业级... |
| ThirdAI NeuralDB | NeuralDB 是由...开发的CPU友好且可微调的向量存储。 |
| TiDB Vector | TiDB Cloud,是一个全面的数据库即服务(DBaaS)解决方案... |
| Tigris | Tigris 是一个开源的 Serverless NoSQL 数据库和搜索平台... |
| TileDB | TileDB 是一个强大的引擎,用于索引和查询密集和稀疏... |
| Timescale Vector (Postgres) | Timescale Vector 是用于AI应用的PostgreSQL++向量数据库。 |
| Typesense | Typesense 是一个开源的内存搜索引擎,你可以... |
| Upstash Vector | Upstash Vector 是一个为处理...设计的无服务器向量数据库 |
| USearch | USearch 是一个更小更快的单文件向量搜索引擎 |
| Vald | Vald 是一个高度可扩展的分布式快速近似最近邻... |
| Intel's Visual Data Management System (VDMS) | Intel的VDMS是一种用于高效访问大“视觉”数据的存储解决方案... |
| Vearch | Vearch 是用于深度学习和人工智能的向量搜索基础设施... |
| Vectara | Vectara 是值得信赖的 AI 助手和代理平台,专注于 ... |
| Vespa | Vespa 是一个功能齐全的搜索引擎和向量数据库。它支持... |
| viking DB | viking DB 是一个用于存储、索引和管理大规模嵌入的数据库... |
| vlite | VLite 是一个简单且极快的向量数据库,允许您... |
| Weaviate | 本笔记本介绍了如何开始使用Weaviate向量存储... |
| Xata | Xata 是一个基于 PostgreSQL 的无服务器数据平台。它提供 ... |
| Yellowbrick | Yellowbrick 是一个弹性的、大规模并行处理(MPP)SQL 数据库... |
| Zep | 回忆、理解并从聊天记录中提取数据。增强个人... |
| Zep Cloud | 从聊天记录中回忆、理解和提取数据。为个性化... |
| Zilliz | Zilliz Cloud 是一个完全托管的云服务,用于 LF AI Milvus®, |