langchain_community.document_loaders.parsers.pdf
.PyPDFium2Parser¶
- class langchain_community.document_loaders.parsers.pdf.PyPDFium2Parser(extract_images: bool = False)[source]¶
使用`PyPDFium2`解析`PDF`。
初始化解析器。
Methods
__init__
([extract_images])初始化解析器。
lazy_parse
(blob)懒惰地解析blob。
parse
(blob)将blob急切地解析为一个文档或多个文档。
- Parameters
extract_images (bool) –
- Return type
None
- __init__(extract_images: bool = False) None [source]¶
初始化解析器。
- Parameters
extract_images (bool) –
- Return type
None