Skip to main content
Open In ColabOpen on GitHub

ReadTheDocs 文档

Read the Docs 是一个开源的免费软件文档托管平台。它生成使用 Sphinx 文档生成器编写的文档。

本笔记本介绍了如何从作为Read-The-Docs构建的一部分生成的HTML中加载内容。

有关此示例的实际应用,请参见这里

这假设HTML已经被抓取到一个文件夹中。这可以通过取消注释并运行以下命令来完成

%pip install --upgrade --quiet  beautifulsoup4
#!wget -r -A.html -P rtdocs https://python.langchain.com/en/latest/
from langchain_community.document_loaders import ReadTheDocsLoader
API Reference:ReadTheDocsLoader
loader = ReadTheDocsLoader("rtdocs", features="html.parser")
docs = loader.load()

这个页面有帮助吗?