向量存储#
向量存储包含摄取文档块的嵌入向量(有时也包括文档块本身)。
简单向量存储#
默认情况下,LlamaIndex 使用一个简单的内存向量存储,非常适合快速实验。可以通过调用 vector_store.persist()
(以及相应的 SimpleVectorStore.from_persist_path(...)
)将其持久化到磁盘上。
向量存储选项和特性支持#
LlamaIndex 支持超过 20 种不同的向量存储选项。我们正在积极添加更多集成,并改进每种选项的特性覆盖。
向量存储 | 类型 | 元数据过滤 | 混合搜索 | 删除 | 存储文档 | 异步 |
---|---|---|---|---|---|---|
阿里云开放搜索 | 云 | ✓ | ✓ | ✓ | ✓ | |
Apache Cassandra® | 自托管 / 云 | ✓ | ✓ | ✓ | ||
Astra DB | 云 | ✓ | ✓ | ✓ | ||
Azure AI 搜索 | 云 | ✓ | ✓ | ✓ | ✓ | |
Azure CosmosDB MongoDB | 云 | ✓ | ✓ | |||
BaiduVectorDB | 云 | ✓ | ✓ | ✓ | ||
ChatGPT 检索插件 | 聚合器 | ✓ | ✓ | |||
Chroma | 自托管 | ✓ | ✓ | ✓ | ||
Couchbase | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | |
DashVector | 云 | ✓ | ✓ | ✓ | ✓ | |
Databricks | 云 | ✓ | ✓ | ✓ | ||
Deeplake | 自托管 / 云 | ✓ | ✓ | ✓ | ||
DocArray | 聚合器 | ✓ | ✓ | ✓ | ||
DuckDB | 内存 / 自托管 | ✓ | ✓ | ✓ | ||
DynamoDB | 云 | ✓ | ||||
Elasticsearch | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | ✓ |
FAISS | 内存 | |||||
txtai | 内存 | |||||
Jaguar | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | |
LanceDB | 云 | ✓ | ✓ | ✓ | ||
Lantern | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | ✓ |
Metal | 云 | ✓ | ✓ | ✓ | ||
MongoDB Atlas | 自托管 / 云 | ✓ | ✓ | ✓ | ||
MyScale | 云 | ✓ | ✓ | ✓ | ✓ | |
Milvus / Zilliz | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | |
Neo4jVector | 自托管 / 云 | ✓ | ✓ | ✓ | ||
OpenSearch | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | ✓ |
Pinecone | 云 | ✓ | ✓ | ✓ | ✓ | |
Postgres | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | ✓ |
pgvecto.rs | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | |
Qdrant | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | ✓ |
Redis | 自托管 / 云 | ✓ | ✓ | ✓ | ||
简单 | 内存中 | ✓ | ✓ | |||
SingleStore | 自托管 / 云 | ✓ | ✓ | ✓ | ||
Supabase | 自托管 / 云 | ✓ | ✓ | ✓ | ||
Tair | 云 | ✓ | ✓ | ✓ | ||
TiDB | 云 | ✓ | ✓ | ✓ | ||
TencentVectorDB | 云 | ✓ | ✓ | ✓ | ✓ | |
Timescale | ✓ | ✓ | ✓ | ✓ | ||
Typesense | 自托管 / 云 | ✓ | ✓ | ✓ | ||
Upstash | 云 | ✓ | ||||
Vearch | 自托管 | ✓ | ✓ | ✓ | ||
Vespa | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ | |
Vertex AI Vector Search | 云 | ✓ | ✓ | ✓ | ||
Weaviate | 自托管 / 云 | ✓ | ✓ | ✓ | ✓ |
更多详情,请参阅向量存储集成。
示例笔记本#
- 阿里云开放搜索
- Astra DB
- 异步索引创建
- Azure AI 搜索
- Azure Cosmos DB
- 百度
- Caasandra
- Chromadb
- Couchbase
- Dash
- Databricks
- Deeplake
- DocArray HNSW
- DocArray in-Memory
- DuckDB
- Espilla
- Jaguar
- LanceDB
- Lantern
- Metal
- Milvus
- Milvus 混合搜索
- MyScale
- ElsaticSearch
- FAISS
- MongoDB Atlas
- Neo4j
- OpenSearch
- Pinecone
- Pinecone 混合搜索
- PGvectoRS
- Postgres
- Redis
- Qdrant
- Qdrant 混合搜索
- Rockset
- Simple
- Supabase
- Tair
- TiDB
- Tencent
- Timesacle
- Upstash
- Vearch
- Vespa
- Vertex AI Vector Search
- Weaviate
- Weaviate混合搜索
- Zep