`langchain_community.document_loaders.glue_catalog`.GlueCatalogLoader¶

class langchain_community.document_loaders.glue_catalog.GlueCatalogLoader(database: str, *, session: Optional[Session] = None, profile_name: Optional[str] = None, table_filter: Optional[List[str]] = None)[source]¶

从AWS Glue加载表模式。

此加载程序获取指定AWS Glue数据库中每个表的模式。模式详细信息包括列名及其数据类型，类似于pandas的dtype表示。

AWS凭证会使用boto3自动加载，遵循标准的AWS方法： https://boto3.amazonaws.com/v1/documentation/api/latest/guide/credentials.html

如果需要特定的AWS配置文件，则可以指定并将用于建立会话。

初始化Glue数据库加载器。

参数：: database：要加载表模式的Glue数据库的名称。 session：可选。一个boto3 Session对象。如果未提供，将创建一个新的会话。 profile_name：可选。用于凭据的AWS配置文件的名称。 table_filter：可选。要获取模式的表名称列表，如果为None，则获取所有表。

Methods

`__init__`(database, *[, session, ...])	初始化Glue数据库加载器。
`alazy_load`()	一个用于文档的惰性加载器。
`aload`()	将数据加载到文档对象中。
`lazy_load`()	惰性加载表模式作为文档对象。
`load`()	将数据加载到文档对象中。
`load_and_split`([text_splitter])	加载文档并分割成块。块作为文档返回。

Parameters

database (str) –
session (Optional[Session]) –
profile_name (Optional[str]) –
table_filter (Optional[List[str]]) –

__init__(database: str, *, session: Optional[Session] = None, profile_name: Optional[str] = None, table_filter: Optional[List[str]] = None)[source]¶

初始化Glue数据库加载器。

参数：: database：要加载表模式的Glue数据库的名称。 session：可选。一个boto3 Session对象。如果未提供，将创建一个新的会话。 profile_name：可选。用于凭据的AWS配置文件的名称。 table_filter：可选。要获取模式的表名称列表，如果为None，则获取所有表。

Parameters

database (str) –
session (Optional[Session]) –
profile_name (Optional[str]) –
table_filter (Optional[List[str]]) –

async alazy_load() → AsyncIterator[Document]¶

一个用于文档的惰性加载器。

Return type: AsyncIterator[Document]

async aload() → List[Document]¶

将数据加载到文档对象中。

Return type: List[Document]

lazy_load() → Iterator[Document][source]¶

惰性加载表模式作为文档对象。

产生：: 每个代表表模式的文档对象。

Return type: Iterator[Document]

load() → List[Document]¶

将数据加载到文档对象中。

Return type: List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) → List[Document]¶

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用！

参数：

text_splitter: 用于分割文档的TextSplitter实例。: 默认为RecursiveCharacterTextSplitter。

返回：

文档列表。

Parameters: text_splitter (Optional[TextSplitter]) –
Return type: List[Document]

Examples using GlueCatalogLoader¶

glue_catalog.md

langchain_community.document_loaders.glue_catalog.GlueCatalogLoader¶

Examples using GlueCatalogLoader¶

`langchain_community.document_loaders.glue_catalog`.GlueCatalogLoader¶