Skip to main content
Open on GitHub

Clarifai

Clarifai 是最早的深度学习平台之一,成立于2013年。Clarifai 提供了一个AI平台,涵盖了数据探索、数据标注、模型训练、评估和推理的完整AI生命周期,适用于图像、视频、文本和音频数据。在LangChain生态系统中,据我们所知,Clarifai 是唯一一个在生产规模平台上支持LLMs、嵌入和向量存储的提供商,使其成为实现LangChain实施的绝佳选择。

Clarifai 提供了数千种适用于许多不同用例的AI模型。您可以在这里探索以找到最适合您用例的模型。这些模型包括由其他提供商创建的模型,如OpenAI、Anthropic、Cohere、AI21等,以及来自开源的最新技术,如Falcon、InstructorXL等,以便您将最好的AI技术融入您的产品中。您会发现这些模型按创建者的user_id组织,并归类到我们称为应用程序的项目中,这些项目由其app_id表示。除了model_id之外,还需要这些ID,以及可选的version_id,因此一旦找到最适合您用例的模型,请记下所有这些ID!

还需注意的是,鉴于有许多用于图像、视频、文本和音频理解的模型,你可以构建一些有趣的AI代理,利用各种AI模型作为专家来理解这些数据类型。

安装与设置

  • 安装Python SDK:
pip install clarifai

注册一个Clarifai账户,然后从您的安全设置中获取个人访问令牌以访问Clarifai API,并将其设置为环境变量(CLARIFAI_PAT)。

大型语言模型

要查找Clarifai平台中的LLMs选择,您可以选择文本到文本模型类型这里

from langchain_community.llms import Clarifai
llm = Clarifai(pat=CLARIFAI_PAT, user_id=USER_ID, app_id=APP_ID, model_id=MODEL_ID)
API Reference:Clarifai

有关更多详细信息,Clarifai LLM 包装器的文档提供了详细的操作指南

嵌入模型

要在Clarifai平台中找到嵌入模型的选择,您可以选择文本到嵌入模型类型这里

LangChain 中有一个 Clarifai Embedding 模型,您可以通过以下方式访问:

from langchain_community.embeddings import ClarifaiEmbeddings
embeddings = ClarifaiEmbeddings(pat=CLARIFAI_PAT, user_id=USER_ID, app_id=APP_ID, model_id=MODEL_ID)
API Reference:ClarifaiEmbeddings

查看使用示例

向量存储

Clarifai的向量数据库于2016年推出,并已优化以支持实时搜索查询。在Clarifai平台的工作流程中,您的数据会自动通过嵌入模型进行索引,并可选地通过其他模型也将该信息索引到数据库中以供搜索。您不仅可以通过向量查询数据库,还可以通过元数据匹配、其他AI预测的概念进行过滤,甚至可以进行地理坐标搜索。只需创建一个应用程序,选择适合您数据类型的基础工作流程,然后上传数据(通过此处记录的API或clarifai.com上的用户界面)。

你也可以直接从LangChain添加数据,自动索引将会为你进行。你会注意到这与其他向量存储有些不同,在其他向量存储中,你需要在它们的构造函数中提供一个嵌入模型,并让LangChain协调从文本中获取嵌入并将这些嵌入写入索引。这不仅更方便,而且使用Clarifai的分布式云在后台进行所有索引操作更具可扩展性。

from langchain_community.vectorstores import Clarifai
clarifai_vector_db = Clarifai.from_texts(user_id=USER_ID, app_id=APP_ID, texts=texts, pat=CLARIFAI_PAT, number_of_docs=NUMBER_OF_DOCS, metadatas = metadatas)
API Reference:Clarifai

更多详情,请参阅Clarifai向量存储的文档,其中提供了详细的操作指南


这个页面有帮助吗?