langchain_community.document_loaders.blob_loaders.file_system.FileSystemBlobLoader

class langchain_community.document_loaders.blob_loaders.file_system.FileSystemBlobLoader(path: Union[str, Path], *, glob: str = '**/[!.]*', exclude: Sequence[str] = (), suffixes: Optional[Sequence[str]] = None, show_progress: bool = False)[source]

在本地文件系统中加载blob。

示例:

from langchain_community.document_loaders.blob_loaders import FileSystemBlobLoader
loader = FileSystemBlobLoader("/path/to/directory")
for blob in loader.yield_blobs():
    print(blob)  # noqa: T201

初始化目录路径和对其进行全局搜索的方式。

参数:
path:要加载的目录路径或要加载的文件路径。

如果提供文件路径,则忽略glob/exclude/suffixes。

glob:相对于指定路径的全局搜索模式

默认设置为选择所有非隐藏文件

exclude:要从结果中排除的模式,使用glob语法 suffixes:提供以仅保留具有这些后缀的文件

想要保留具有不同后缀的文件时很有用 后缀必须包括点,例如”.txt”

show_progress:如果为True,则在加载文件时显示进度条。

这将强制迭代所有匹配的文件 在加载文件之前对它们进行计数。

示例:

Methods

__init__(path, *[, glob, exclude, suffixes, ...])

初始化目录路径和对其进行全局搜索的方式。

count_matching_files()

计算与模式匹配的文件数量,而无需加载它们。

yield_blobs()

产生与请求模式匹配的块。

Parameters
  • path (Union[str, Path]) –

  • glob (str) –

  • exclude (Sequence[str]) –

  • suffixes (Optional[Sequence[str]]) –

  • show_progress (bool) –

Return type

None

__init__(path: Union[str, Path], *, glob: str = '**/[!.]*', exclude: Sequence[str] = (), suffixes: Optional[Sequence[str]] = None, show_progress: bool = False) None[source]

初始化目录路径和对其进行全局搜索的方式。

参数:
path:要加载的目录路径或要加载的文件路径。

如果提供文件路径,则忽略glob/exclude/suffixes。

glob:相对于指定路径的全局搜索模式

默认设置为选择所有非隐藏文件

exclude:要从结果中排除的模式,使用glob语法 suffixes:提供以仅保留具有这些后缀的文件

想要保留具有不同后缀的文件时很有用 后缀必须包括点,例如”.txt”

show_progress:如果为True,则在加载文件时显示进度条。

这将强制迭代所有匹配的文件 在加载文件之前对它们进行计数。

示例:

Parameters
  • path (Union[str, Path]) –

  • glob (str) –

  • exclude (Sequence[str]) –

  • suffixes (Optional[Sequence[str]]) –

  • show_progress (bool) –

Return type

None

count_matching_files() int[source]

计算与模式匹配的文件数量,而无需加载它们。

Return type

int

yield_blobs() Iterable[Blob][source]

产生与请求模式匹配的块。

Return type

Iterable[Blob]

Examples using FileSystemBlobLoader