BaseBlobParser#

class langchain_core.document_loaders.base.BaseBlobParser[source]#

Blob解析器的抽象接口。

一个blob解析器提供了一种将存储在blob中的原始数据解析为一个或多个文档的方法。

解析器可以与blob加载器组合使用,使得解析器可以独立于blob最初加载的方式进行重用。

方法

lazy_parse(blob)

懒解析接口。

parse(blob)

急切地将blob解析为一个或多个文档。

abstract lazy_parse(blob: Blob) Iterator[Document][source]#

惰性解析接口。

子类需要实现这个方法。

Parameters:

blob (Blob) – Blob 实例

Returns:

文档生成器

Return type:

迭代器[文档]

parse(blob: Blob) list[Document][source]#

急切地将blob解析为一个或多个文档。

这是一个用于交互式开发环境的便捷方法。

生产应用程序应优先使用lazy_parse方法。

子类通常不应重写此解析方法。

Parameters:

blob (Blob) – Blob 实例

Returns:

文档列表

Return type:

列表[Document]

使用 BaseBlobParser 的示例