Skip to main content

美味汤

美味汤(Beautiful Soup)是一个用于解析HTML和XML文档的Python软件包(包括处理格式不正确的标记,即未闭合标签,因此得名于标记汤)。它为解析页面创建了一个解析树,可用于从HTML中提取数据,这对于网络抓取很有用。[3]

安装和设置

pip install beautifulsoup4

文档转换器

查看使用示例

from langchain_community.document_loaders import BeautifulSoupTransformer

Was this page helpful?


You can leave detailed feedback on GitHub.