generate_size_based_batches#

langchain_community.utilities.pebblo.generate_size_based_batches(docs: List[Document], max_batch_size: int = 102400) List[List[Document]][source]#

根据page_content大小生成文档批次。 :param docs: 要分批次处理的文档列表。 :param max_batch_size: 每个批次的最大大小(以字节为单位)。默认为100*1024(100KB)

Returns:

文档批次列表

Return type:

列表[列表[Document]]

Parameters:
  • 文档 (列表[文档])

  • max_batch_size (int)