多租户策略
随着ChatGPT的普及,越来越多的开发人员正在使用CVP(ChatGPT、向量数据库、提示)堆栈创建自己的SaaS服务。本指南解释了如何在Milvus上实现多租户,Milvus是世界上使用最广泛的向量数据库之一,以跟上这一趋势。
多租户是一种架构,其中单个Milvus实例为多个租户提供服务。区分租户的最简单方法是将他们的数据和资源与其他人分开。每个租户都有自己专用的资源,或与其他人共享资源,以管理Milvus对象,如数据库、集合和分区。基于这些对象,有相应的方法来实现Milvus多租户。
面向数据库的多租户
自Milvus 2.2.9版本起,对象数据库现已可用。您可以在单个Milvus集群中创建多个数据库。通过为每个租户分配一个数据库,可以实现面向数据库的多租户,使他们可以创建自己的集合和分区,以充分利用其数据。然而,这种策略确保了租户的数据隔离和搜索性能,但资源可能会浪费在空闲的租户身上。
面向集合的多租户
有两种可能的方法可以实现面向集合的多租户。
所有租户共用一个集合
通过向单个集合添加一个租户字段来实现多租户,以区分不同的租户,这是一个简单的选择。在为特定租户进行ANN搜索时,添加一个过滤表达式,以过滤掉属于其他租户的所有实体。这是实现多租户的最简单方法。但要注意,过滤器的性能可能成为ANN搜索的瓶颈。
每个租户一个集合
另一种方法是为每个租户创建一个集合来存储其自己的数据,而不是将所有租户的数据存储在单个集合中。这提供了更好的数据隔离和查询性能。然而,请记住,这种方法需要更多的资源调度、运营能力和成本投入,如果租户数量超过单个Milvus集群支持的最大集合数量,则可能不适用。