QuipLoader#

class langchain_community.document_loaders.quip.QuipLoader(api_url: str, access_token: str, request_timeout: int | None = 60, *, allow_dangerous_xml_parsing: bool = False)[来源]#

加载 Quip 页面。

端口来自 quip/quip-api

Parameters:

方法

__init__(api_url, access_token[, ...])

alazy_load()

一个用于文档的懒加载器。

aload()

将数据加载到Document对象中。

get_thread_ids_by_folder_id(folder_id, ...)

通过文件夹ID获取线程ID并更新thread_ids

lazy_load()

一个用于文档的懒加载器。

load([folder_ids, thread_ids, max_docs, ...])

:param : param folder_ids: 要加载的特定文件夹ID列表,默认为None :param : param thread_ids: 要加载的特定线程ID列表,默认为None :param : param max_docs: 总共要检索的最大文档数,默认为1000 :param : param include_all_folders: 包括您的access_token可以访问的所有文件夹,但不包括您的私人文件夹 :param : param include_comments: 包括评论,默认为False :param : param include_images: 包括图片,默认为False

load_and_split([text_splitter])

加载文档并将其分割成块。

process_thread(thread_id, include_images, ...)

process_thread_images(tree)

process_thread_messages(thread_id)

process_threads(thread_ids, include_images, ...)

将一系列线程处理成一系列文档。

__init__(api_url: str, access_token: str, request_timeout: int | None = 60, *, allow_dangerous_xml_parsing: bool = False)[source]#
Parameters:
async alazy_load() AsyncIterator[Document]#

文档的懒加载器。

Return type:

AsyncIterator[Document]

async aload() list[Document]#

将数据加载到Document对象中。

Return type:

列表[Document]

get_thread_ids_by_folder_id(folder_id: str, depth: int, thread_ids: List[str]) None[source]#

通过文件夹ID获取线程ID并更新到thread_ids中

Parameters:
  • folder_id (str)

  • 深度 (整数)

  • thread_ids (列表[字符串])

Return type:

lazy_load() Iterator[Document]#

文档的懒加载器。

Return type:

迭代器[文档]

load(folder_ids: List[str] | None = None, thread_ids: List[str] | None = None, max_docs: int | None = 1000, include_all_folders: bool = False, include_comments: bool = False, include_images: bool = False) List[Document][来源]#

:param : param folder_ids: 要加载的特定文件夹ID列表,默认为None :param : param thread_ids: 要加载的特定线程ID列表,默认为None :param : param max_docs: 总共要检索的最大文档数,默认为1000 :param : param include_all_folders: 包括您的access_token有权访问的所有文件夹

可以访问,但不包括您的私人文件夹

:param : param include_comments: 包含评论,默认为 False :param : param include_images: 包含图片,默认为 False

Parameters:
  • folder_ids (列表[字符串] | )

  • thread_ids (列表[字符串] | )

  • max_docs (int | None)

  • include_all_folders (bool)

  • include_comments (bool)

  • include_images (bool)

Return type:

列表[文档]

load_and_split(text_splitter: TextSplitter | None = None) list[Document]#

加载文档并将其分割成块。块以文档形式返回。

不要重写此方法。它应该被视为已弃用!

Parameters:

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。

Returns:

文档列表。

Return type:

列表[Document]

process_thread(thread_id: str, include_images: bool, include_messages: bool) Document | None[source]#
Parameters:
  • thread_id (str)

  • include_images (bool)

  • include_messages (bool)

Return type:

Document | 无

process_thread_images(tree: ElementTree) str[source]#
Parameters:

(元素树)

Return type:

字符串

process_thread_messages(thread_id: str) str[source]#
Parameters:

thread_id (str)

Return type:

字符串

process_threads(thread_ids: Sequence[str], include_images: bool, include_messages: bool) List[Document][source]#

将线程列表处理为文档列表。

Parameters:
  • thread_ids (序列[字符串])

  • include_images (bool)

  • include_messages (布尔值)

Return type:

列表[文档]

使用 QuipLoader 的示例