`langchain_community.document_loaders.pdf`.BasePDFLoader¶

class langchain_community.document_loaders.pdf.BasePDFLoader(file_path: Union[str, Path], *, headers: Optional[Dict] = None)[source]¶

用于`PDF`文件的基本加载器类。

如果文件是网络路径，则会将其下载到临时文件中，使用后再清理临时文件。

使用文件路径进行初始化。

Attributes

source

Methods

Parameters

__init__(file_path: Union[str, Path], *, headers: Optional[Dict] = None)[source]¶

使用文件路径进行初始化。

Parameters

async alazy_load() → AsyncIterator[Document]¶

一个用于文档的惰性加载器。

async aload() → List[Document]¶

将数据加载到文档对象中。

lazy_load() → Iterator[Document]¶

一个用于文档的惰性加载器。

load() → List[Document]¶

将数据加载到文档对象中。

load_and_split(text_splitter: Optional[TextSplitter] = None) → List[Document]¶

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用！

参数：

返回：

文档列表。

langchain_community.document_loaders.pdf.BasePDFLoader¶