Skip to content

LlamaHub#

我们的数据连接器通过LlamaHub 🦙提供。 LlamaHub 包含了一个开源数据连接器注册表,您可以轻松地将其插入任何 LlamaIndex 应用程序(+ 代理工具和 Llama Packs)。

使用模式#

开始使用:

from llama_index.core import download_loader

from llama_index.readers.google import GoogleDocsReader

loader = GoogleDocsReader()
documents = loader.load_data(document_ids=[...])

内置连接器:SimpleDirectoryReader#

SimpleDirectoryReader。可以支持解析包括.md.pdf.jpg.png.docx在内的多种文件类型,以及音频和视频类型。它直接作为 LlamaIndex 的一部分可用:

from llama_index.core import SimpleDirectoryReader

documents = SimpleDirectoryReader("./data").load_data()

可用连接器#

直接浏览LlamaHub,查看数百个可用的连接器,包括:

  • Notion (NotionPageReader)
  • Google Docs (GoogleDocsReader)
  • Slack (SlackReader)
  • Discord (DiscordReader)
  • Apify Actors (ApifyActor)。可以爬取网页,抓取网页内容,提取文本内容,下载包括.pdf.jpg.png.docx等文件。