Embedding models | 🦜️🔗 LangChain

📄️ 阿莱夫·阿尔法

阿莱夫·阿尔法的语义嵌入有两种可能的使用方式。如果您有结构不同的文本（例如文档和查询），您会希望使用不对称嵌入。相反，对于结构相似的文本，建议采用对称嵌入。

📄️ AwaDB

AwaDB 是一种用于搜索和存储由 LLM 应用程序使用的嵌入向量的 AI 本地数据库。

📄️ Azure OpenAI

让我们使用设置了指示使用 Azure 端点的环境变量来加载 Azure OpenAI Embedding 类。

📄️ 百川文本嵌入

截至今日（2024年1月25日），百川文本嵌入在 C-MTEB（中文多任务嵌入基准）排行榜中名列第一。

📄️ 百度千帆

百度AI云千帆平台是一个为企业开发者提供一站式大型模型开发和服务运营的平台。千帆不仅提供文心译言（ERNIE-Bot）模型和第三方开源模型，还提供各种人工智能开发工具和完整的开发环境，方便客户轻松使用和开发大型模型应用。

亚马逊基石是一项完全托管的服务，提供了来自领先人工智能公司如AI21 Labs、Anthropic、Cohere、Meta、Stability AI和Amazon的高性能基础模型（FMs），通过单一 API，以及您构建生成式人工智能应用所需的广泛功能，包括安全性、隐私性和负责任的人工智能。使用亚马逊基石，您可以轻松尝试和评估适合您用例的顶级 FMs，使用微调和检索增强生成（RAG）等技术私密定制它们，并构建执行任务的代理，这些代理使用您的企业系统和数据源。由于亚马逊基石是无服务器的，您无需管理任何基础设施，可以安全地集成和部署生成式人工智能功能到您已熟悉的 AWS 服务中。

📄️ Hugging Face 上的 BGE 模型

Hugging Face 上的 BGE 模型被认为是最好的开源嵌入模型。

📄️ Bookend AI

让我们加载 Bookend AI Embeddings 类。

📄️ Clarifai

Clarifai 是一个 AI 平台，提供从数据探索、数据标注、模型训练、评估到推断的完整 AI 生命周期。

📄️ Cloudflare Workers AI

Cloudflare, Inc. (维基百科) 是一家提供内容交付网络服务、云安全服务、DDoS 攻击防护以及 ICANN 认证域名注册服务的美国公司。

📄️ Cohere

让我们加载 Cohere 嵌入类。

📄️ DashScope

让我们加载 DashScope 嵌入类。

📄️ DeepInfra

DeepInfra 是一种无服务器推理服务，提供对各种LLM模型和嵌入模型的访问。本笔记介绍了如何使用 LangChain 结合 DeepInfra 进行文本嵌入。

📄️ EDEN AI

Eden AI正在通过整合最优秀的AI提供商，赋予用户解锁无限可能性的能力，发挥人工智能的真正潜力，从而彻底改变人工智能领域。通过一体化全面且无障碍的平台，用户可以快速将AI功能部署到生产环境，通过单一API轻松访问完整的AI功能范围。 (网站//edenai.co/)

📄️ Elasticsearch

使用托管的嵌入模型在Elasticsearch中生成嵌入的详细步骤

📄️ Embaas

embaas 是一个完全托管的自然语言处理（NLP）API服务，提供诸如嵌入生成、文档文本提取、文档到嵌入等功能。您可以选择各种预训练模型。

📄️ ERNIE

ERNIE Embedding-V1 是基于百度文心大规模模型技术的文本表示模型，将文本转换为由数值表示的向量形式，可用于文本检索、信息推荐、知识挖掘等场景。

📄️ 虚假嵌入

LangChain 还提供了一个虚假嵌入类。您可以使用这个类来测试您的流水线。

📄️ Qdrant 的 FastEmbed

Qdrant 公司推出的 FastEmbed 是一个轻量、快速的 Python 库，专为嵌入式生成而设计。

📄️ FireworksEmbeddings

本文介绍如何使用 Fireworks Embeddings，它包含在 langchain_fireworks 软件包中，用于在 langchain 中嵌入文本。在本示例中，我们使用默认的 nomic-ai v1.5 模型。

📄️ GigaChat

本笔记本展示了如何使用 LangChain 与 GigaChat embeddings。要使用它，您需要安装 `gigachat` Python 包。

📄️ 谷歌生成式 AI 嵌入

使用 GoogleGenerativeAIEmbeddings 类连接到谷歌的生成式 AI 嵌入服务，该类位于 langchain-google-genai 包中。

📄️ 谷歌 Vertex AI PaLM

Vertex AI PaLM API 是谷歌云上的一个服务，提供了嵌入模型。

📄️ GPT4All

GPT4All 是一个免费使用的本地运行的、注重隐私的聊天机器人。无需 GPU 或互联网。它包含了流行的模型和自己的模型，如 GPT4All Falcon、Wizard 等。

📄️ 梯度

Gradient 允许使用简单的网络 API 创建 Embeddings，并对 LLMs 进行微调和完成。

📄️ Hugging Face

让我们加载 Hugging Face 嵌入类。

📄️ IBM watsonx.ai

WatsonxEmbeddings 是 IBM watsonx.ai 基础模型的封装。

📄️ 无穷大

Infinity 允许使用 MIT 许可的嵌入服务器创建 Embeddings。

📄️ Hugging Face 上的 Instruct Embeddings

Hugging Face 句子转换器是一个用于最先进的句子、文本和图像嵌入的 Python 框架。

📄️ Intel® Extension for Transformers 量化文本嵌入

加载由 Intel® Extension for Transformers (ITREX) 生成的量化 BGE 嵌入模型，并使用 ITREX 神经引擎，这是一个高性能的 NLP 后端，以加速模型的推断，同时不影响准确性。

📄️ Jina

让我们加载 Jina 嵌入类。

📄️ John Snow Labs

John Snow Labs 的 NLP & LLM 生态系统包括用于大规模 AI 的软件库、负责任的 AI、无代码 AI，以及超过 20,000 个用于医疗、法律、金融等领域的模型。

📄️ LASER（Language-Agnostic SEntence Representations）：Meta AI 的多语言句子表示嵌入库

LASER 是由 Meta AI 研究团队开发的 Python 库，用于创建超过 147 种语言的多语言句子嵌入，截至 2024 年 2 月 25 日。

📄️ Llama-cpp

本文介绍如何在 LangChain 中使用 Llama-cpp 嵌入。

📄️ llamafile

让我们加载 llamafile 嵌入类。

📄️ LLMRails

让我们加载 LLMRails Embeddings 类。

📄️ 本地AI

让我们加载 LocalAI 嵌入类。为了使用 LocalAI 嵌入类，你需要在某个地方托管 LocalAI 服务并配置嵌入模型。请参阅文档 https//localai.io/features/embeddings/index.html。

📄️ MiniMax

MiniMax 提供嵌入式服务。

📄️ MistralAI

本文介绍如何使用 MistralAIEmbeddings，在 langchain_mistralai 包中提供的功能，将文本嵌入到 langchain 中。

📄️ ModelScope

ModelScope 是一个大型的模型和数据集仓库。

📄️ MosaicML

MosaicML 提供了一个托管的推理服务。您可以使用各种开源模型，或者部署自己的模型。

📄️ NVIDIA NeMo 嵌入

使用 NeMoEmbeddings 类连接到 NVIDIA 的嵌入服务。

📄️ NLP Cloud

NLP Cloud 是一个人工智能平台，允许您使用最先进的AI引擎，甚至可以使用自己的数据训练自己的引擎。

📄️ Nomic

本笔记介绍了如何开始使用 Nomic 嵌入模型。

📄️ NVIDIA AI Foundation Endpoints

NVIDIA AI Foundation Endpoints 提供了便捷的方式让用户访问 NVIDIA 托管的 API 端点，用于访问 NVIDIA AI 基础模型，如 Mixtral 8x7B、Llama 2、Stable Diffusion 等。这些模型托管在NVIDIA API 目录上，经过优化、测试，并在 NVIDIA AI 平台上托管，使其快速且易于评估，进一步定制，并在任何加速堆栈上以最佳性能无缝运行。