langchain_community.document_loaders.max_compute
.MaxComputeLoader¶
- class langchain_community.document_loaders.max_compute.MaxComputeLoader(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[source]¶
从`阿里云MaxCompute`表中加载。
初始化阿里云MaxCompute文档加载器。
- 参数:
query: 要执行的SQL查询。 api_wrapper: MaxCompute API包装器。 page_content_columns: 要写入文档的`page_content`的列。如果未指定,所有列将被写入`page_content`。 metadata_columns: 要写入文档的`metadata`的列。如果未指定,所有未添加到`page_content`的列将被写入。
Methods
__init__
(query, api_wrapper, *[, ...])初始化阿里云MaxCompute文档加载器。
一个用于文档的惰性加载器。
aload
()将数据加载到文档对象中。
from_params
(query, endpoint, project, *[, ...])方便的构造函数,根据给定的参数构建MaxCompute API包装器。
一个用于文档的惰性加载器。
load
()将数据加载到文档对象中。
load_and_split
([text_splitter])加载文档并分割成块。块作为文档返回。
- Parameters
query (str) –
api_wrapper (MaxComputeAPIWrapper) –
page_content_columns (Optional[Sequence[str]]) –
metadata_columns (Optional[Sequence[str]]) –
- __init__(query: str, api_wrapper: MaxComputeAPIWrapper, *, page_content_columns: Optional[Sequence[str]] = None, metadata_columns: Optional[Sequence[str]] = None)[source]¶
初始化阿里云MaxCompute文档加载器。
- 参数:
query: 要执行的SQL查询。 api_wrapper: MaxCompute API包装器。 page_content_columns: 要写入文档的`page_content`的列。如果未指定,所有列将被写入`page_content`。 metadata_columns: 要写入文档的`metadata`的列。如果未指定,所有未添加到`page_content`的列将被写入。
- Parameters
query (str) –
api_wrapper (MaxComputeAPIWrapper) –
page_content_columns (Optional[Sequence[str]]) –
metadata_columns (Optional[Sequence[str]]) –
- classmethod from_params(query: str, endpoint: str, project: str, *, access_id: Optional[str] = None, secret_access_key: Optional[str] = None, **kwargs: Any) MaxComputeLoader [source]¶
方便的构造函数,根据给定的参数构建MaxCompute API包装器。
- 参数:
query: 要执行的SQL查询。 endpoint: MaxCompute端点。 project: 项目是MaxCompute的基本组织单元,类似于数据库。 access_id: MaxCompute访问ID。应直接传递或设置为环境变量`MAX_COMPUTE_ACCESS_ID`。 secret_access_key: MaxCompute秘密访问密钥。应直接传递或设置为环境变量`MAX_COMPUTE_SECRET_ACCESS_KEY`。
- Parameters
query (str) –
endpoint (str) –
project (str) –
access_id (Optional[str]) –
secret_access_key (Optional[str]) –
kwargs (Any) –
- Return type
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并分割成块。块作为文档返回。
不要覆盖此方法。应该被视为已弃用!
- 参数:
- text_splitter: 用于分割文档的TextSplitter实例。
默认为RecursiveCharacterTextSplitter。
- 返回:
文档列表。
- Parameters
text_splitter (Optional[TextSplitter]) –
- Return type
List[Document]