Skip to main content
Open on GitHub

HTML 转文本

html2text 是一个Python包,它将HTML页面转换为干净、易于阅读的纯ASCII文本

ASCII 也恰好是一个有效的 Markdown(一种文本到HTML的格式)。

安装与设置

pip install html2text

文档转换器

查看使用示例

from langchain_community.document_loaders import Html2TextTransformer

这个页面有帮助吗?