结构化数据提取#
LLM 能够摄取大量非结构化数据,并以结构化格式返回,而 LlamaIndex 设计用于简化此过程。
使用 LlamaIndex,您可以让 LLM 读取自然语言并识别语义重要的细节,如姓名、日期、地址和数字,并以一致的结构化格式返回,而不受源格式的影响。
当您有非结构化的源材料,如聊天记录和对话文本时,这将特别有用。
一旦您获得了结构化数据,您可以将其发送到数据库,或者您可以在代码中解析结构化输出以自动化工作流程。
核心指南#
查看我们的结构化输出指南,了解使用 LlamaIndex 进行结构化数据提取的全面概述。您可以将其作为独立的程序(Pydantic 程序)进行操作,或作为 RAG 管道的一部分。我们还提供了独立的输出解析模块,您可以使用它们与 LLM / 提示一起使用。
我们还提供了多模态结构化数据提取。点击查看。
杂项示例#
一些额外的杂项示例,突出使用案例: