磁盘存储
备注
本内容已迁移至 无法整个放入内存的索引 (Indexes that do not fit in RAM) 页面。
当你处理的数据量过大,无法全部加载到内存(RAM)时,可将 Faiss 索引的数据存储在磁盘上。这种方法对于超大规模的向量库检索尤其适用,例如数十亿级别的文本、图片向量搜索等场景。
相关技术说明
在 Faiss 中,部分索引类型支持“磁盘存储”模式。这意味着原始向量数据和/或部分索引结构可以保存在硬盘上,减轻内存压力,但可能导致检索速度有所降低。
提示
磁盘存储模式通常搭配 IndexIVF(倒排文件索引,Inverted File Index)和 IndexIVF-PQ(倒排+乘积量化 Product Quantizer)这类适合大数据场景的索引使用。
典型使用场景
- 当数据量超出单台服务器内存
- 要处理大规模向量集合(例如10亿条以上)
- 需要节省运行成本(使用更小内存机器)
如何配置磁盘存储
详细的使用方法及代码示例请参考 无法整个放入内存的索引 (Indexes that do not fit in RAM) 页面。
重要提示
important
磁盘存储虽然大大缓解了内存压力,但会显著降低向量检索的速度。因此,实际部署时需要在性能与资源之间权衡。
更多资料
