PebbloTextLoader#

class langchain_community.document_loaders.pebblo.PebbloTextLoader(texts: Iterable[str], *, source: str | None = None, ids: List[str] | None = None, metadata: Dict[str, Any] | None = None, metadatas: List[Dict[str, Any]] | None = None)[source]#

文本数据的加载器。

由于PebbloSafeLoader是文档加载器的包装器,此加载器用于将文本数据直接加载到Documents中。

Parameters:
  • texts (Iterable[str]) – 文本数据的可迭代对象。

  • source (str | None) – 文本数据的来源。 可选。默认为 None。

  • ids (List[str] | None) – 每个文本的唯一标识符列表。 可选。默认为 None。

  • metadata (Dict[str, Any] | None) – 所有文本的元数据。 可选。默认为 None。

  • metadatas (List[Dict[str, Any]] | None) – 每个文本的元数据列表。 可选。默认为 None。

方法

__init__(texts, *[, source, ids, metadata, ...])

alazy_load()

文档的懒加载器。

aload()

将数据加载到Document对象中。

lazy_load()

将文本数据懒加载到文档中。

load()

将文本数据加载到文档中。

load_and_split([text_splitter])

加载文档并将其分割成块。

__init__(texts: Iterable[str], *, source: str | None = None, ids: List[str] | None = None, metadata: Dict[str, Any] | None = None, metadatas: List[Dict[str, Any]] | None = None) None[来源]#
Parameters:
  • texts (Iterable[str]) – 文本数据的可迭代对象。

  • source (str | None) – 文本数据的来源。 可选。默认为 None。

  • ids (List[str] | None) – 每个文本的唯一标识符列表。 可选。默认为 None。

  • metadata (Dict[str, Any] | None) – 所有文本的元数据。 可选。默认为 None。

  • metadatas (List[Dict[str, Any]] | None) – 每个文本的元数据列表。 可选。默认为 None。

Return type:

async alazy_load() AsyncIterator[Document]#

文档的懒加载器。

Return type:

AsyncIterator[Document]

async aload() list[Document]#

将数据加载到Document对象中。

Return type:

列表[Document]

lazy_load() Iterator[Document][source]#

将文本数据懒加载到文档中。

Returns:

文档的迭代器

Return type:

迭代器[文档]

load() List[Document][来源]#

将文本数据加载到文档中。

Returns:

文档列表

Return type:

列表[文档]

load_and_split(text_splitter: TextSplitter | None = None) list[Document]#

加载文档并将其分割成块。块以文档形式返回。

不要重写此方法。它应该被视为已弃用!

Parameters:

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。

Returns:

文档列表。

Return type:

列表[Document]