CassandraLoader#
- class langchain_community.document_loaders.cassandra.CassandraLoader(table: Optional[str] = None, session: Optional[Session] = None, keyspace: Optional[str] = None, query: Union[str, Statement, None] = None, page_content_mapper: Callable[[Any], str] = <class 'str'>, metadata_mapper: Callable[[Any], dict] = <function CassandraLoader.<lambda>>, *, query_parameters: Union[dict, Sequence, None] = None, query_timeout: Optional[float] = <object object>, query_trace: bool = False, query_custom_payload: Optional[dict] = None, query_execution_profile: Any = <object object>, query_paging_state: Any = None, query_host: Optional[Host] = None, query_execute_as: Optional[str] = None)[来源]#
Apache Cassandra 的文档加载器。
- Parameters:
table (可选[str]) – 要从中加载数据的表。 (不要与查询参数一起使用)
session (可选[Session]) – Cassandra驱动程序的会话。 如果未提供,将使用cassio解析的会话。
keyspace (可选[str]) – 表的keyspace。 如果未提供,将使用cassio解析的keyspace。
query (Union[str, Statement, None]) – 用于加载数据的查询。 (不要与table参数一起使用)
page_content_mapper (Callable[[Any], str]) – 一个将行转换为字符串页面内容的函数。 默认为行的字符串表示。
metadata_mapper (Callable[[Any], dict]) – 一个将行转换为文档元数据的函数。
query_parameters (Union[dict, Sequence, None]) – 调用 session.execute 时使用的查询参数。
query_timeout (可选[float]) – 调用 session.execute 时使用的查询超时时间。
query_trace (bool) – 在调用 session.execute 时是否使用追踪。
query_custom_payload (Optional[dict]) – 调用 session.execute 时使用的查询自定义负载。
query_execution_profile (Any) – 调用 session.execute 时使用的查询执行配置文件。
query_host (可选[Host]) – 调用 session.execute 时使用的查询主机。
query_execute_as (可选[str]) – 调用 session.execute 时使用的 query_execute_as。
query_paging_state (Any)
方法
__init__
([table, session, keyspace, query, ...])Apache Cassandra 的文档加载器。
文档的懒加载器。
aload
()将数据加载到Document对象中。
一个用于文档的懒加载器。
load
()将数据加载到Document对象中。
load_and_split
([text_splitter])加载文档并将其分割成块。
- __init__(table: Optional[str] = None, session: Optional[Session] = None, keyspace: Optional[str] = None, query: Union[str, Statement, None] = None, page_content_mapper: Callable[[Any], str] = <class 'str'>, metadata_mapper: Callable[[Any], dict] = <function CassandraLoader.<lambda>>, *, query_parameters: Union[dict, Sequence, None] = None, query_timeout: Optional[float] = <object object>, query_trace: bool = False, query_custom_payload: Optional[dict] = None, query_execution_profile: Any = <object object>, query_paging_state: Any = None, query_host: Optional[Host] = None, query_execute_as: Optional[str] = None) None [source]#
Apache Cassandra 的文档加载器。
- Parameters:
table (可选[str]) – 要从中加载数据的表。 (不要与查询参数一起使用)
session (可选[Session]) – Cassandra驱动程序的会话。 如果未提供,将使用cassio解析的会话。
keyspace (可选[str]) – 表的keyspace。 如果未提供,将使用cassio解析的keyspace。
query (Union[str, Statement, None]) – 用于加载数据的查询。 (不要与table参数一起使用)
page_content_mapper (Callable[[Any], str]) – 一个将行转换为字符串页面内容的函数。 默认为行的字符串表示。
metadata_mapper (Callable[[Any], dict]) – 一个将行转换为文档元数据的函数。
query_parameters (Union[dict, Sequence, None]) – 调用 session.execute 时使用的查询参数。
query_timeout (可选[float]) – 调用 session.execute 时使用的查询超时时间。
query_trace (bool) – 在调用 session.execute 时是否使用追踪。
query_custom_payload (Optional[dict]) – 调用 session.execute 时使用的查询自定义负载。
query_execution_profile (Any) – 调用 session.execute 时使用的查询执行配置文件。
query_host (可选[Host]) – 调用 session.execute 时使用的查询主机。
query_execute_as (可选[str]) – 调用 session.execute 时使用的 query_execute_as。
query_paging_state (Any)
- Return type:
无
- load_and_split(text_splitter: TextSplitter | None = None) list[Document] #
加载文档并将其分割成块。块以文档形式返回。
不要重写此方法。它应该被视为已弃用!
- Parameters:
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。
- Returns:
文档列表。
- Return type:
列表[Document]
使用CassandraLoader的示例