instructor-embeddings 库是另一个选择,尤其是在运行于具备cuda能力的GPU的机器上时。它们是OpenAI的良好本地替代方案(参见 Massive Text Embedding Benchmark 排名)。嵌入函数需要InstructorEmbedding包。要安装它,请运行 pip install InstructorEmbedding
。
有三个模型可供选择。默认的是 hkunlp/instructor-base
,为了获得更好的性能,您可以使用 hkunlp/instructor-large
或 hkunlp/instructor-xl
。您还可以指定是使用 cpu
(默认)还是 cuda
。例如:
或者
请注意,大型和xl模型分别为1.5GB和5GB,最适合在GPU上运行。