Skip to main content
Open on GitHub

Doctran

Doctran 是一个 Python 包。它使用 LLMs 和开源 NLP 库将原始文本转换为干净、结构化、信息密集的文档,这些文档针对向量空间检索进行了优化。你可以将 Doctran 视为一个黑盒子,混乱的字符串输入,干净、整洁、标记好的字符串输出。

安装与设置

pip install doctran

文档转换器

文档询问器

查看DoctranQATransformer的使用示例

from langchain_community.document_loaders import DoctranQATransformer

属性提取器

查看DoctranPropertyExtractor的使用示例

from langchain_community.document_loaders import DoctranPropertyExtractor

文档翻译器

查看DoctranTextTranslator的使用示例

from langchain_community.document_loaders import DoctranTextTranslator

这个页面有帮助吗?