文件系统Blob加载器#

class langchain_community.document_loaders.blob_loaders.file_system.FileSystemBlobLoader(path: str | Path, *, glob: str = '**/[!.]*', exclude: Sequence[str] = (), suffixes: Sequence[str] | None = None, show_progress: bool = False)[source]#

加载本地文件系统中的blobs。

示例:

from langchain_community.document_loaders.blob_loaders import FileSystemBlobLoader
loader = FileSystemBlobLoader("/path/to/directory")
for blob in loader.yield_blobs():
    print(blob)  # noqa: T201

使用目录路径以及如何对其进行全局匹配进行初始化。

Parameters:
  • path (str | Path) – 要加载的目录路径或要加载的文件路径。 如果提供了文件路径,则忽略 glob/exclude/suffixes。

  • glob (str) – 相对于指定路径的Glob模式 默认设置为选择所有非隐藏文件

  • exclude (Sequence[str]) – 从结果中排除的模式,使用glob语法

  • suffixes (Sequence[str] | None) – 提供以仅保留具有这些后缀的文件 当希望保留具有不同后缀的文件时非常有用 后缀必须包含点,例如“.txt”

  • show_progress (bool) – 如果为真,将在加载文件时显示进度条。 这会在加载之前强制遍历所有匹配的文件以进行计数。

示例

方法

__init__(path, *[, glob, exclude, suffixes, ...])

使用目录路径以及如何对其进行全局初始化。

count_matching_files()

计算匹配模式的文件数量而不加载它们。

yield_blobs()

生成与请求模式匹配的blobs。

__init__(path: str | Path, *, glob: str = '**/[!.]*', exclude: Sequence[str] = (), suffixes: Sequence[str] | None = None, show_progress: bool = False) None[source]#

使用目录路径以及如何对其进行全局匹配进行初始化。

Parameters:
  • path (str | Path) – 要加载的目录路径或要加载的文件路径。 如果提供了文件路径,则忽略 glob/exclude/suffixes。

  • glob (str) – 相对于指定路径的Glob模式 默认设置为选择所有非隐藏文件

  • exclude (Sequence[str]) – 从结果中排除的模式,使用glob语法

  • suffixes (Sequence[str] | None) – 提供以仅保留具有这些后缀的文件 当希望保留具有不同后缀的文件时非常有用 后缀必须包含点,例如“.txt”

  • show_progress (bool) – 如果为真,将在加载文件时显示进度条。 这会在加载之前强制遍历所有匹配的文件以进行计数。

Return type:

示例

count_matching_files() int[source]#

计算符合模式的文件数量而不加载它们。

Return type:

整数

yield_blobs() Iterable[Blob][source]#

生成与请求模式匹配的blobs。

Return type:

可迭代[Blob]

使用 FileSystemBlobLoader 的示例