🗃️ 系统架构
5 个项目
🗃️ 系统配置
20 个项目
📄️ 使用数组字段
本指南解释了如何使用数组字段,包括插入数组值以及在数组字段中使用基本和高级运算符进行搜索和查询。
📄️ Milvus 2.2基准测试报告
本报告展示了Milvus 2.2.0的主要测试结果。旨在展示Milvus 2.2.0在搜索性能方面的情况,特别是在扩展性能和横向扩展能力方面。
📄️ 位集
本主题介绍了位集机制,该机制有助于在 Milvus 中实现属性过滤和删除操作等关键功能。
📄️ 标量过滤规则
概述
📄️ 一致性
本主题介绍了 Milvus 中的四种一致性级别及它们最适合的场景。同时也涵盖了确保 Milvus 一致性的机制。
📄️ 协调器高可用性
如 Milvus 架构 所示,Milvus 由许多组件组成,并以分布式方式运行。在所有组件中,Milvus 通过对节点进行 横向扩展和纵向扩展 来确保工作节点的高可用性,使协调器成为链条中唯一的薄弱环节。
📄️ 磁盘索引
本文介绍了一种名为 DiskANN 的磁盘索引算法。基于 Vamana 图,DiskANN 可以在大型数据集内实现高效搜索。
📄️ 术语表
AutoID
📄️ GPU 索引
Milvus 支持各种 GPU 索引类型,以加速搜索性能和效率,特别是在高吞吐量、低延迟和高召回率的场景下。本主题概述了 Milvus 支持的 GPU 索引类型,它们适用的用例以及性能特征。有关使用 GPU 构建索引的信息,请参考 使用 GPU 构建索引。
📄️ Knowhere
本主题介绍了 Milvus 的核心向量执行引擎 Knowhere。
📄️ 内存索引
本主题列出了 Milvus 支持的各种内存索引类型,以及它们最适合的场景和用户可以配置的参数,以实现更好的搜索性能。有关磁盘索引,请参阅 磁盘索引。
📄️ 相似度度量
在Milvus中,相似度度量方法用于衡量向量之间的相似性。选择一个好的距离度量方法可以显著提高分类和聚类的性能。
📄️ MMap-启用的数据存储
在 Milvus 中,内存映射文件允许将文件内容直接映射到内存中。这一特性提高了内存利用效率,特别是在可用内存稀缺但完整数据加载不可行的情况下。这种优化机制可以增加数据容量,同时确保性能达到一定限制;然而,当数据量远远超过内存时,搜索和查询性能可能会严重下降,因此请根据需要选择是否启用此功能。
📄️ 多租户策略
随着ChatGPT的普及,越来越多的开发人员正在使用CVP(ChatGPT、向量数据库、提示)堆栈创建自己的SaaS服务。本指南解释了如何在Milvus上实现多租户,Milvus是世界上使用最广泛的向量数据库之一,以跟上这一趋势。
📄️ 内存副本
本主题介绍了 Milvus 中的内存副本(复制)机制,该机制允许在工作内存中进行多个段的复制,以提高性能和可用性。
📄️ 重新排序
Milvus 使用 hybridsearch() API 实现多向量搜索功能,结合复杂的重新排序策略,以精细化搜索结果来自多个 AnnSearchRequest 实例。本主题涵盖了重新排序过程,解释了在 Milvus 中不同重新排序策略的重要性和实现方法。
📄️ 标量索引
Milvus支持结合标量和向量字段进行过滤搜索。为了增强涉及标量字段的搜索效率,Milvus从版本2.1.0开始引入了标量字段索引。本文概述了Milvus中的标量字段索引,帮助您了解其重要性和实现方式。
📄️ 管理模式
本主题介绍了Milvus中的模式。模式用于定义集合的属性以及其中的字段。
📄️ 稀疏向量
稀疏向量使用向量嵌入来表示单词或短语,其中大多数元素为零,只有一个非零元素表示特定单词的存在。稀疏向量模型,如SPLADEv2,在跨领域知识搜索、关键词感知和可解释性方面优于密集模型。它们在信息检索 、自然语言处理和推荐系统中特别有用,将稀疏向量用于召回,结合大型模型用于排序,可以显著改善检索结果。
📄️ 时间同步
本主题介绍了 Milvus 中的时间同步机制。
📄️ Milvus 中的时间戳
本主题解释了时间戳的概念,并介绍了 Milvus 向量数据库中的四个主要与时间戳相关的参数。
📄️ 用户和角色
本主题解释了基于角色的访问控制(RBAC)中用户、角色、对象和权限的定义。