langchain_community.document_loaders.duckdb_loader.DuckDBLoader

class langchain_community.document_loaders.duckdb_loader.DuckDBLoader(query: str, database: str = ':memory:', read_only: bool = False, config: Optional[Dict[str, str]] = None, page_content_columns: Optional[List[str]] = None, metadata_columns: Optional[List[str]] = None)[source]

从`DuckDB`加载。

每个文档代表结果的一行。page_content_columns`写入文档的`page_contentmetadata_columns`写入文档的`metadata。默认情况下,所有列都写入`page_content`,而没有写入`metadata`。

参数: query: 要执行的查询。 database: 要连接的数据库。默认为“:memory:”。 read_only: 是否以只读模式打开数据库。默认为False。 config: 要传递给数据库的配置选项字典。可选。 page_content_columns: 要写入文档的`page_content`中的列。可选。 metadata_columns: 要写入文档的`metadata`中的列。可选。

Methods

__init__(query[, database, read_only, ...])

参数: query: 要执行的查询。 database: 要连接的数据库。默认为“:memory:”。 read_only: 是否以只读模式打开数据库。默认为False。 config: 要传递给数据库的配置选项字典。可选。 page_content_columns: 要写入文档的`page_content`中的列。可选。 metadata_columns: 要写入文档的`metadata`中的列。可选。

alazy_load()

一个用于文档的惰性加载器。

aload()

将数据加载到文档对象中。

lazy_load()

一个用于文档的惰性加载器。

load()

将数据加载到文档对象中。

load_and_split([text_splitter])

加载文档并分割成块。块作为文档返回。

Parameters
  • query (str) –

  • database (str) –

  • read_only (bool) –

  • config (Optional[Dict[str, str]]) –

  • page_content_columns (Optional[List[str]]) –

  • metadata_columns (Optional[List[str]]) –

__init__(query: str, database: str = ':memory:', read_only: bool = False, config: Optional[Dict[str, str]] = None, page_content_columns: Optional[List[str]] = None, metadata_columns: Optional[List[str]] = None)[source]

参数: query: 要执行的查询。 database: 要连接的数据库。默认为“:memory:”。 read_only: 是否以只读模式打开数据库。默认为False。 config: 要传递给数据库的配置选项字典。可选。 page_content_columns: 要写入文档的`page_content`中的列。可选。 metadata_columns: 要写入文档的`metadata`中的列。可选。

Parameters
  • query (str) –

  • database (str) –

  • read_only (bool) –

  • config (Optional[Dict[str, str]]) –

  • page_content_columns (Optional[List[str]]) –

  • metadata_columns (Optional[List[str]]) –

async alazy_load() AsyncIterator[Document]

一个用于文档的惰性加载器。

Return type

AsyncIterator[Document]

async aload() List[Document]

将数据加载到文档对象中。

Return type

List[Document]

lazy_load() Iterator[Document]

一个用于文档的惰性加载器。

Return type

Iterator[Document]

load() List[Document][source]

将数据加载到文档对象中。

Return type

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用!

参数:
text_splitter: 用于分割文档的TextSplitter实例。

默认为RecursiveCharacterTextSplitter。

返回:

文档列表。

Parameters

text_splitter (Optional[TextSplitter]) –

Return type

List[Document]

Examples using DuckDBLoader