Skip to main content

HTML转文本

html2text 是一个将HTML页面转换为清晰易读的纯ASCII文本的Python软件包。

这个ASCII文本也恰好是有效的Markdown(一种文本到HTML的格式)。

安装和设置

pip install html2text

文档转换器

查看一个使用示例

from langchain_community.document_loaders import Html2TextTransformer

Was this page helpful?


You can leave detailed feedback on GitHub.