`langchain_community.document_loaders.word_document`.Docx2txtLoader¶

class langchain_community.document_loaders.word_document.Docx2txtLoader(file_path: Union[str, Path])[source]¶

使用`docx2txt`加载`DOCX`文件，并以字符级别进行分块。

默认情况下检查本地文件，但如果文件是Web路径，则会下载到临时文件中，然后使用该文件，完成后清理临时文件。

使用文件路径进行初始化。

Methods

__init__(file_path: Union[str, Path])[source]¶

使用文件路径进行初始化。

async alazy_load() → AsyncIterator[Document]¶

一个用于文档的惰性加载器。

async aload() → List[Document]¶

将数据加载到文档对象中。

lazy_load() → Iterator[Document]¶

一个用于文档的惰性加载器。

将给定路径加载为单个页面。

load_and_split(text_splitter: Optional[TextSplitter] = None) → List[Document]¶

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用！

参数：

返回：

文档列表。

Examples using Docx2txtLoader¶