langchain_community.document_loaders.tidb
.TiDBLoader¶
- class langchain_community.document_loaders.tidb.TiDBLoader(connection_string: str, query: str, page_content_columns: Optional[List[str]] = None, metadata_columns: Optional[List[str]] = None, engine_args: Optional[Dict[str, Any]] = None)[source]¶
从TiDB加载文档。
初始化 TiDB 文档加载器。
- 参数:
- connection_string (str):TiDB 数据库的连接字符串,
格式:”mysql+pymysql://root@127.0.0.1:4000/test”。
query:在 TiDB 中运行的查询。 page_content_columns:可选。写入到文档 page_content 的列,默认为所有列。 metadata_columns:可选。写入到文档 metadata 的列,默认为空。 engine_args:可选。传递给 sqlalchemy 引擎的额外参数。
Methods
__init__
(connection_string, query[, ...])初始化 TiDB 文档加载器。
一个用于文档的惰性加载器。
aload
()将数据加载到文档对象中。
将TiDB数据延迟加载到文档对象中。
load
()将数据加载到文档对象中。
load_and_split
([text_splitter])加载文档并分割成块。块作为文档返回。
- Parameters
connection_string (str) –
query (str) –
page_content_columns (Optional[List[str]]) –
metadata_columns (Optional[List[str]]) –
engine_args (Optional[Dict[str, Any]]) –
- Return type
None
- __init__(connection_string: str, query: str, page_content_columns: Optional[List[str]] = None, metadata_columns: Optional[List[str]] = None, engine_args: Optional[Dict[str, Any]] = None) None [source]¶
初始化 TiDB 文档加载器。
- 参数:
- connection_string (str):TiDB 数据库的连接字符串,
格式:”mysql+pymysql://root@127.0.0.1:4000/test”。
query:在 TiDB 中运行的查询。 page_content_columns:可选。写入到文档 page_content 的列,默认为所有列。 metadata_columns:可选。写入到文档 metadata 的列,默认为空。 engine_args:可选。传递给 sqlalchemy 引擎的额外参数。
- Parameters
connection_string (str) –
query (str) –
page_content_columns (Optional[List[str]]) –
metadata_columns (Optional[List[str]]) –
engine_args (Optional[Dict[str, Any]]) –
- Return type
None
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并分割成块。块作为文档返回。
不要覆盖此方法。应该被视为已弃用!
- 参数:
- text_splitter: 用于分割文档的TextSplitter实例。
默认为RecursiveCharacterTextSplitter。
- 返回:
文档列表。
- Parameters
text_splitter (Optional[TextSplitter]) –
- Return type
List[Document]