DuckDBLoader#

class langchain_community.document_loaders.duckdb_loader.DuckDBLoader(query: str, database: str = ':memory:', read_only: bool = False, config: Dict[str, str] | None = None, page_content_columns: List[str] | None = None, metadata_columns: List[str] | None = None)[source]#

DuckDB 加载。

每个文档代表结果的一行。page_content_columns被写入文档的page_content中。metadata_columns被写入文档的metadata中。默认情况下,所有列都被写入page_content,而不写入metadata

Parameters:
  • query (str) – 要执行的查询。

  • database (str) – 要连接的数据库。默认为“:memory:”。

  • read_only (bool) – 是否以只读模式打开数据库。默认为 False。

  • config (Dict[str, str] | None) – 一个包含配置选项的字典,用于传递给数据库。 可选。

  • page_content_columns (List[str] | None) – 要写入文档page_content的列。可选。

  • metadata_columns (List[str] | None) – 要写入文档metadata的列。 可选。

方法

__init__(query[, database, read_only, ...])

alazy_load()

一个用于文档的懒加载器。

aload()

将数据加载到Document对象中。

lazy_load()

一个用于文档的懒加载器。

load()

将数据加载到Document对象中。

load_and_split([text_splitter])

加载文档并将其分割成块。

__init__(query: str, database: str = ':memory:', read_only: bool = False, config: Dict[str, str] | None = None, page_content_columns: List[str] | None = None, metadata_columns: List[str] | None = None)[source]#
Parameters:
  • query (str) – 要执行的查询。

  • database (str) – 要连接的数据库。默认为“:memory:”。

  • read_only (bool) – 是否以只读模式打开数据库。默认为 False。

  • config (Dict[str, str] | None) – 一个包含配置选项的字典,用于传递给数据库。 可选。

  • page_content_columns (List[str] | None) – 要写入文档page_content的列。可选。

  • metadata_columns (List[str] | None) – 要写入文档metadata的列。 可选。

async alazy_load() AsyncIterator[Document]#

文档的懒加载器。

Return type:

AsyncIterator[Document]

async aload() list[Document]#

将数据加载到Document对象中。

Return type:

列表[Document]

lazy_load() Iterator[Document]#

文档的懒加载器。

Return type:

迭代器[文档]

load() List[Document][source]#

将数据加载到Document对象中。

Return type:

列表[文档]

load_and_split(text_splitter: TextSplitter | None = None) list[Document]#

加载文档并将其分割成块。块以文档形式返回。

不要重写此方法。它应该被视为已弃用!

Parameters:

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。

Returns:

文档列表。

Return type:

列表[Document]

使用 DuckDBLoader 的示例