跳到主要内容

磁盘存储

当你处理的数据量过大,无法全部加载到内存(RAM)时,可将 Faiss 索引的数据存储在磁盘上。这种方法对于超大规模的向量库检索尤其适用,例如数十亿级别的文本、图片向量搜索等场景。

相关技术说明

在 Faiss 中,部分索引类型支持“磁盘存储”模式。这意味着原始向量数据和/或部分索引结构可以保存在硬盘上,减轻内存压力,但可能导致检索速度有所降低。

提示

磁盘存储模式通常搭配 IndexIVF(倒排文件索引,Inverted File Index)和 IndexIVF-PQ(倒排+乘积量化 Product Quantizer)这类适合大数据场景的索引使用。

典型使用场景

  • 当数据量超出单台服务器内存
  • 要处理大规模向量集合(例如10亿条以上)
  • 需要节省运行成本(使用更小内存机器)

如何配置磁盘存储

详细的使用方法及代码示例请参考 无法整个放入内存的索引 (Indexes that do not fit in RAM) 页面。

重要提示

important

磁盘存储虽然大大缓解了内存压力,但会显著降低向量检索的速度。因此,实际部署时需要在性能与资源之间权衡。

更多资料

磁盘存储索引结构示意图