使用OpenVINO进行本地嵌入¶

OpenVINO™是一个用于优化和部署AI推断的开源工具包。OpenVINO™ Runtime支持各种硬件设备，包括x86和ARM CPU，以及Intel GPU。它可以帮助提升计算机视觉、自动语音识别、自然语言处理和其他常见任务中的深度学习性能。

Hugging Face嵌入模型可以通过OpenVINOEmbedding类来支持OpenVINO。

如果您在colab上打开这个笔记本，您可能需要安装LlamaIndex 🦙。

In [ ]:

Copied!

%pip install llama-index-embeddings-huggingface-openvino
%pip install llama-index-embeddings-huggingface-openvino

In [ ]:

Copied!

!pip install llama-index
!pip install llama-index

模型导出器¶

可以使用create_and_save_openvino_model函数将模型导出为OpenVINO IR格式，并从本地文件夹加载模型。

In [ ]:

Copied!

from llama_index.embeddings.huggingface_openvino import OpenVINOEmbedding

OpenVINOEmbedding.create_and_save_openvino_model(
    "BAAI/bge-small-en-v1.5", "./bge_ov"
)
from llama_index.embeddings.huggingface_openvino import OpenVINOEmbedding

OpenVINOEmbedding.create_and_save_openvino_model(
    "BAAI/bge-small-en-v1.5", "./bge_ov"
)

模型加载¶

如果您有英特尔GPU，可以指定device="gpu"来在其上运行推断。

In [ ]:

Copied!

ov_embed_model = OpenVINOEmbedding(folder_name="./bge_ov", device="cpu")
ov_embed_model = OpenVINOEmbedding(folder_name="./bge_ov", device="cpu")

In [ ]:

Copied!

embeddings = ov_embed_model.get_text_embedding("Hello World!")
print(len(embeddings))
print(embeddings[:5])
embeddings = ov_embed_model.get_text_embedding("Hello World!")
print(len(embeddings))
print(embeddings[:5])

有关更多信息，请参考：