PebbloTextLoader#
- class langchain_community.document_loaders.pebblo.PebbloTextLoader(texts: Iterable[str], *, source: str | None = None, ids: List[str] | None = None, metadata: Dict[str, Any] | None = None, metadatas: List[Dict[str, Any]] | None = None)[source]#
文本数据的加载器。
由于PebbloSafeLoader是文档加载器的包装器,此加载器用于将文本数据直接加载到Documents中。
- Parameters:
texts (Iterable[str]) – 文本数据的可迭代对象。
source (str | None) – 文本数据的来源。 可选。默认为 None。
ids (List[str] | None) – 每个文本的唯一标识符列表。 可选。默认为 None。
metadata (Dict[str, Any] | None) – 所有文本的元数据。 可选。默认为 None。
metadatas (List[Dict[str, Any]] | None) – 每个文本的元数据列表。 可选。默认为 None。
方法
__init__
(texts, *[, source, ids, metadata, ...])文档的懒加载器。
aload
()将数据加载到Document对象中。
将文本数据懒加载到文档中。
load
()将文本数据加载到文档中。
load_and_split
([text_splitter])加载文档并将其分割成块。
- __init__(texts: Iterable[str], *, source: str | None = None, ids: List[str] | None = None, metadata: Dict[str, Any] | None = None, metadatas: List[Dict[str, Any]] | None = None) None [来源]#
- Parameters:
texts (Iterable[str]) – 文本数据的可迭代对象。
source (str | None) – 文本数据的来源。 可选。默认为 None。
ids (List[str] | None) – 每个文本的唯一标识符列表。 可选。默认为 None。
metadata (Dict[str, Any] | None) – 所有文本的元数据。 可选。默认为 None。
metadatas (List[Dict[str, Any]] | None) – 每个文本的元数据列表。 可选。默认为 None。
- Return type:
无
- load_and_split(text_splitter: TextSplitter | None = None) list[Document] #
加载文档并将其分割成块。块以文档形式返回。
不要重写此方法。它应该被视为已弃用!
- Parameters:
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。
- Returns:
文档列表。
- Return type:
列表[Document]