Skip to content

结构化数据提取#

LLM 能够摄取大量非结构化数据,并以结构化格式返回,而 LlamaIndex 设计用于简化此过程。

使用 LlamaIndex,您可以让 LLM 读取自然语言并识别语义重要的细节,如姓名、日期、地址和数字,并以一致的结构化格式返回,而不受源格式的影响。

当您有非结构化的源材料,如聊天记录和对话文本时,这将特别有用。

一旦您获得了结构化数据,您可以将其发送到数据库,或者您可以在代码中解析结构化输出以自动化工作流程。

核心指南#

查看我们的结构化输出指南,了解使用 LlamaIndex 进行结构化数据提取的全面概述。您可以将其作为独立的程序(Pydantic 程序)进行操作,或作为 RAG 管道的一部分。我们还提供了独立的输出解析模块,您可以使用它们与 LLM / 提示一起使用。

我们还提供了多模态结构化数据提取。点击查看

杂项示例#

一些额外的杂项示例,突出使用案例: