Html2TextTransformer#

class langchain_community.document_transformers.html2text.Html2TextTransformer(ignore_links: bool = True, ignore_images: bool = True)[source]#

用替换字符串替换特定搜索模式的出现

Parameters:
  • ignore_links (bool) – 是否应忽略链接;默认为 True。

  • ignore_images (bool) – 是否应忽略图像;默认为 True。

示例

方法

__init__([ignore_links, ignore_images])

atransform_documents(documents, **kwargs)

异步转换文档列表。

transform_documents(documents, **kwargs)

转换文档列表。

__init__(ignore_links: bool = True, ignore_images: bool = True) None[source]#
Parameters:
  • ignore_links (bool)

  • ignore_images (bool)

Return type:

async atransform_documents(documents: Sequence[Document], **kwargs: Any) Sequence[Document][source]#

异步转换文档列表。

Parameters:
  • documents (Sequence[Document]) – 要转换的文档序列。

  • kwargs (Any)

Returns:

一系列转换后的文档。

Return type:

序列[文档]

transform_documents(documents: Sequence[Document], **kwargs: Any) Sequence[Document][source]#

转换文档列表。

Parameters:
  • documents (Sequence[Document]) – 要转换的文档序列。

  • kwargs (Any)

Returns:

一系列转换后的文档。

Return type:

序列[文档]

使用 Html2TextTransformer 的示例