`langchain_community.document_loaders.chromium`.AsyncChromiumLoader¶

class langchain_community.document_loaders.chromium.AsyncChromiumLoader(urls: List[str], *, headless: bool = True)[source]¶

使用无头Chromium实例从URL中抓取HTML页面。

用URL路径列表初始化加载器。

Methods

`__init__`(urls, *[, headless])	用URL路径列表初始化加载器。
`alazy_load`()	从提供的URL异步加载文本内容。
`aload`()	将数据加载到文档对象中。
`ascrape_playwright`(url)	使用Playwright的异步API异步地抓取给定URL的内容。
`lazy_load`()	从提供的URL中延迟加载文本内容。
`load`()	将数据加载到文档对象中。
`load_and_split`([text_splitter])	加载文档并分割成块。块作为文档返回。

Parameters

__init__(urls: List[str], *, headless: bool = True)[source]¶

用URL路径列表初始化加载器。

Parameters

async alazy_load() → AsyncIterator[Document][source]¶

从提供的URL异步加载文本内容。

该方法利用asyncio同时启动所有提供的URL的抓取，通过利用并发的异步请求来提高性能。每个文档在其内容可用时被产生，封装了抓取的内容。

async aload() → List[Document]¶

将数据加载到文档对象中。

async ascrape_playwright(url: str) → str[source]¶

使用Playwright的异步API异步地抓取给定URL的内容。

lazy_load() → Iterator[Document][source]¶

从提供的URL中延迟加载文本内容。

该方法逐个生成文档，而不是等待所有URL被抓取后再返回。

load() → List[Document]¶

将数据加载到文档对象中。

load_and_split(text_splitter: Optional[TextSplitter] = None) → List[Document]¶

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用！

参数：

返回：

文档列表。

Examples using AsyncChromiumLoader¶