MaxComputeLoader#

class langchain_community.document_loaders.max_compute.MaxComputeLoader(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Sequence[str] | None = None, metadata_columns: Sequence[str] | None = None)[source]#

阿里云MaxCompute表加载。

初始化阿里云MaxCompute文档加载器。

Parameters:
  • query (str) – 要执行的SQL查询。

  • api_wrapper (MaxComputeAPIWrapper) – MaxCompute API 封装器。

  • page_content_columns (可选[序列[字符串]]) – 要写入page_content的列。如果未指定,所有列都将写入page_content

  • metadata_columns (可选[序列[字符串]]) – 要写入文档元数据的列。 如果未指定,所有未添加到页面内容的列都将被写入。

方法

__init__(query, api_wrapper, *[, ...])

初始化阿里云MaxCompute文档加载器。

alazy_load()

一个用于文档的懒加载器。

aload()

将数据加载到Document对象中。

from_params(query, endpoint, project, *[, ...])

方便的构造函数,用于从MaxCompute API包装器构建

lazy_load()

一个用于文档的懒加载器。

load()

将数据加载到Document对象中。

load_and_split([text_splitter])

加载文档并将其分割成块。

__init__(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Sequence[str] | None = None, metadata_columns: Sequence[str] | None = None)[source]#

初始化阿里云MaxCompute文档加载器。

Parameters:
  • query (str) – 要执行的SQL查询。

  • api_wrapper (MaxComputeAPIWrapper) – MaxCompute API 封装器。

  • page_content_columns (Sequence[str] | None) – 要写入page_content的列。如果未指定,所有列都将写入page_content

  • metadata_columns (Sequence[str] | None) – 要写入metadata的列。 如果未指定,所有未添加到page_content的列都将被写入。

async alazy_load() AsyncIterator[Document]#

文档的懒加载器。

Return type:

AsyncIterator[Document]

async aload() list[Document]#

将数据加载到Document对象中。

Return type:

列表[Document]

classmethod from_params(query: str, endpoint: str, project: str, *, access_id: str | None = None, secret_access_key: str | None = None, **kwargs: Any) MaxComputeLoader[source]#
Convenience constructor that builds the MaxCompute API wrapper from

给定的参数。

Parameters:
  • query (str) – 要执行的SQL查询。

  • endpoint (str) – MaxCompute 端点。

  • project (str) – 项目是MaxCompute的基本组织单位,类似于数据库。

  • access_id (str | None) – MaxCompute 访问 ID。应直接传入或设置为环境变量 MAX_COMPUTE_ACCESS_ID

  • secret_access_key (str | None) – MaxCompute 密钥访问密钥。应直接传入或设置为环境变量 MAX_COMPUTE_SECRET_ACCESS_KEY

  • kwargs (Any)

Return type:

MaxComputeLoader

lazy_load() Iterator[Document][source]#

文档的懒加载器。

Return type:

迭代器[文档]

load() list[Document]#

将数据加载到Document对象中。

Return type:

列表[Document]

load_and_split(text_splitter: TextSplitter | None = None) list[Document]#

加载文档并将其分割成块。块以文档形式返回。

不要重写此方法。它应该被视为已弃用!

Parameters:

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。

Returns:

文档列表。

Return type:

列表[Document]

使用 MaxComputeLoader 的示例