指导者

instructor-embeddings 库是另一个选择,尤其是在运行于具备cuda能力的GPU的机器上时。它们是OpenAI的良好本地替代方案(参见 Massive Text Embedding Benchmark 排名)。嵌入函数需要InstructorEmbedding包。要安装它,请运行 pip install InstructorEmbedding

有三个模型可供选择。默认的是 hkunlp/instructor-base,为了获得更好的性能,您可以使用 hkunlp/instructor-largehkunlp/instructor-xl。您还可以指定是使用 cpu(默认)还是 cuda。例如:

python

或者

python

请注意,大型和xl模型分别为1.5GB和5GB,最适合在GPU上运行。