提供者更多HTML 转文本On this pageHTML 转文本 html2text 是一个Python包,它将HTML页面转换为干净、易于阅读的纯ASCII文本。 ASCII 也恰好是一个有效的 Markdown(一种文本到HTML的格式)。 安装与设置 pip install html2text 文档转换器 查看使用示例。 from langchain_community.document_loaders import Html2TextTransformer