langchain_community.document_loaders.rocksetdb.RocksetLoader

class langchain_community.document_loaders.rocksetdb.RocksetLoader(client: ~typing.Any, query: ~typing.Any, content_keys: ~typing.List[str], metadata_keys: ~typing.Optional[~typing.List[str]] = None, content_columns_joiner: ~typing.Callable[[~typing.List[~typing.Tuple[str, ~typing.Any]]], str] = <function default_joiner>)[source]

从`Rockset`数据库加载。

要使用,您应该已经安装了`rockset` python包。

示例:
# 这段代码将从"langchain_demo"集合中加载3条记录作为文档,使用`text`列作为内容

from langchain_community.document_loaders import RocksetLoader
from rockset import RocksetClient, Regions, models

loader = RocksetLoader(
    RocksetClient(Regions.usw2a1, "<api key>"),
    models.QueryRequestSql(
        query="select * from langchain_demo limit 3"
    ),
    ["text"]
)

)

初始化Rockset客户端。

参数:

client:Rockset客户端对象。 query:Rockset查询对象。 content_keys:要写入文档的`page_content`的集合列。 metadata_keys:要写入文档的`metadata`的集合列。默认情况下,这是文档中的所有键。 content_columns_joiner:将content_keys及其值连接成字符串的方法。这是一个接受List[Tuple[str, Any]]参数的方法,表示(column name, column value)元组列表。默认情况下,这是一个将每个列值与新行连接的方法。只有在存在多个content_keys时,此方法才相关。

Methods

__init__(client, query, content_keys[, ...])

初始化Rockset客户端。

alazy_load()

一个用于文档的惰性加载器。

aload()

将数据加载到文档对象中。

lazy_load()

一个用于文档的惰性加载器。

load()

将数据加载到文档对象中。

load_and_split([text_splitter])

加载文档并分割成块。块作为文档返回。

Parameters
  • client (Any) –

  • query (Any) –

  • content_keys (List[str]) –

  • metadata_keys (Optional[List[str]]) –

  • content_columns_joiner (Callable[[List[Tuple[str, Any]]], str]) –

__init__(client: ~typing.Any, query: ~typing.Any, content_keys: ~typing.List[str], metadata_keys: ~typing.Optional[~typing.List[str]] = None, content_columns_joiner: ~typing.Callable[[~typing.List[~typing.Tuple[str, ~typing.Any]]], str] = <function default_joiner>)[source]

初始化Rockset客户端。

参数:

client:Rockset客户端对象。 query:Rockset查询对象。 content_keys:要写入文档的`page_content`的集合列。 metadata_keys:要写入文档的`metadata`的集合列。默认情况下,这是文档中的所有键。 content_columns_joiner:将content_keys及其值连接成字符串的方法。这是一个接受List[Tuple[str, Any]]参数的方法,表示(column name, column value)元组列表。默认情况下,这是一个将每个列值与新行连接的方法。只有在存在多个content_keys时,此方法才相关。

Parameters
  • client (Any) –

  • query (Any) –

  • content_keys (List[str]) –

  • metadata_keys (Optional[List[str]]) –

  • content_columns_joiner (Callable[[List[Tuple[str, Any]]], str]) –

async alazy_load() AsyncIterator[Document]

一个用于文档的惰性加载器。

Return type

AsyncIterator[Document]

async aload() List[Document]

将数据加载到文档对象中。

Return type

List[Document]

lazy_load() Iterator[Document][source]

一个用于文档的惰性加载器。

Return type

Iterator[Document]

load() List[Document]

将数据加载到文档对象中。

Return type

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用!

参数:
text_splitter: 用于分割文档的TextSplitter实例。

默认为RecursiveCharacterTextSplitter。

返回:

文档列表。

Parameters

text_splitter (Optional[TextSplitter]) –

Return type

List[Document]

Examples using RocksetLoader