LlamaHub#
我们的数据连接器通过LlamaHub 🦙提供。 LlamaHub 包含了一个开源数据连接器注册表,您可以轻松地将其插入任何 LlamaIndex 应用程序(+ 代理工具和 Llama Packs)。
使用模式#
开始使用:
from llama_index.core import download_loader
from llama_index.readers.google import GoogleDocsReader
loader = GoogleDocsReader()
documents = loader.load_data(document_ids=[...])
内置连接器:SimpleDirectoryReader#
SimpleDirectoryReader
。可以支持解析包括.md
、.pdf
、.jpg
、.png
、.docx
在内的多种文件类型,以及音频和视频类型。它直接作为 LlamaIndex 的一部分可用:
from llama_index.core import SimpleDirectoryReader
documents = SimpleDirectoryReader("./data").load_data()
可用连接器#
直接浏览LlamaHub,查看数百个可用的连接器,包括:
- Notion (
NotionPageReader
) - Google Docs (
GoogleDocsReader
) - Slack (
SlackReader
) - Discord (
DiscordReader
) - Apify Actors (
ApifyActor
)。可以爬取网页,抓取网页内容,提取文本内容,下载包括.pdf
、.jpg
、.png
、.docx
等文件。