`langchain_community.document_loaders.max_compute`.MaxComputeLoader¶

class langchain_community.document_loaders.max_compute.MaxComputeLoader(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[source]¶

从`阿里云MaxCompute`表中加载。

初始化阿里云MaxCompute文档加载器。

参数：: query: 要执行的SQL查询。 api_wrapper: MaxCompute API包装器。 page_content_columns: 要写入文档的`page_content`的列。如果未指定，所有列将被写入`page_content`。 metadata_columns: 要写入文档的`metadata`的列。如果未指定，所有未添加到`page_content`的列将被写入。

Methods

`__init__`(query, api_wrapper, *[, ...])	初始化阿里云MaxCompute文档加载器。
`alazy_load`()	一个用于文档的惰性加载器。
`aload`()	将数据加载到文档对象中。
`from_params`(query, endpoint, project, *[, ...])	方便的构造函数，根据给定的参数构建MaxCompute API包装器。
`lazy_load`()	一个用于文档的惰性加载器。
`load`()	将数据加载到文档对象中。
`load_and_split`([text_splitter])	加载文档并分割成块。块作为文档返回。

Parameters

query (str) –
api_wrapper (MaxComputeAPIWrapper) –
page_content_columns (Optional[Sequence[str]]) –
metadata_columns (Optional[Sequence[str]]) –

__init__(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[source]¶

初始化阿里云MaxCompute文档加载器。

参数：: query: 要执行的SQL查询。 api_wrapper: MaxCompute API包装器。 page_content_columns: 要写入文档的`page_content`的列。如果未指定，所有列将被写入`page_content`。 metadata_columns: 要写入文档的`metadata`的列。如果未指定，所有未添加到`page_content`的列将被写入。

Parameters

query (str) –
api_wrapper (MaxComputeAPIWrapper) –
page_content_columns (Optional[Sequence[str]]) –
metadata_columns (Optional[Sequence[str]]) –

async alazy_load() → AsyncIterator[Document]¶

一个用于文档的惰性加载器。

Return type: AsyncIterator[Document]

async aload() → List[Document]¶

将数据加载到文档对象中。

Return type: List[Document]

classmethod from_params(query: str, endpoint: str, project: str, *, access_id: Optional[str] = None, secret_access_key: Optional[str] = None, **kwargs: Any) → MaxComputeLoader[source]¶

方便的构造函数，根据给定的参数构建MaxCompute API包装器。

参数:: query: 要执行的SQL查询。 endpoint: MaxCompute端点。 project: 项目是MaxCompute的基本组织单元，类似于数据库。 access_id: MaxCompute访问ID。应直接传递或设置为环境变量`MAX_COMPUTE_ACCESS_ID`。 secret_access_key: MaxCompute秘密访问密钥。应直接传递或设置为环境变量`MAX_COMPUTE_SECRET_ACCESS_KEY`。

Parameters

query (str) –
endpoint (str) –
project (str) –
access_id (Optional[str]) –
secret_access_key (Optional[str]) –
kwargs (Any) –

Return type

MaxComputeLoader

lazy_load() → Iterator[Document][source]¶

一个用于文档的惰性加载器。

Return type: Iterator[Document]

load() → List[Document]¶

将数据加载到文档对象中。

Return type: List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) → List[Document]¶

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用！

参数：

text_splitter: 用于分割文档的TextSplitter实例。: 默认为RecursiveCharacterTextSplitter。

返回：

文档列表。

Parameters: text_splitter (Optional[TextSplitter]) –
Return type: List[Document]

Examples using MaxComputeLoader¶

Alibaba Cloud
alibaba_cloud_maxcompute.md

langchain_community.document_loaders.max_compute.MaxComputeLoader¶

Examples using MaxComputeLoader¶

`langchain_community.document_loaders.max_compute`.MaxComputeLoader¶