langchain_community.document_loaders.url_playwright
.UnstructuredHtmlEvaluator¶
- class langchain_community.document_loaders.url_playwright.UnstructuredHtmlEvaluator(remove_selectors: Optional[List[str]] = None)[source]¶
使用`unstructured`库评估页面的HTML内容。
初始化UnstructuredHtmlEvaluator。
Methods
__init__
([remove_selectors])初始化UnstructuredHtmlEvaluator。
evaluate
(page, browser, response)同步处理页面的HTML内容。
evaluate_async
(page, browser, response)异步处理页面的HTML内容。
- Parameters
remove_selectors (Optional[List[str]]) –
- __init__(remove_selectors: Optional[List[str]] = None)[source]¶
初始化UnstructuredHtmlEvaluator。
- Parameters
remove_selectors (Optional[List[str]]) –