langchain_community.document_loaders.notebook
.NotebookLoader¶
- class langchain_community.document_loaders.notebook.NotebookLoader(path: Union[str, Path], include_outputs: bool = False, max_output_length: int = 10, remove_newline: bool = False, traceback: bool = False)[source]¶
加载 Jupyter notebook (.ipynb) 文件。
使用路径进行初始化。
- 参数:
path: 从中加载笔记本的路径。 include_outputs: 是否包括单元格的输出。
默认为False。
- max_output_length: 要显示的输出的最大长度。
默认为10。
- remove_newline: 是否从笔记本中删除换行符。
默认为False。
- traceback: 是否返回错误的回溯信息。
默认为False。
Methods
__init__
(path[, include_outputs, ...])使用路径进行初始化。
一个用于文档的惰性加载器。
aload
()将数据加载到文档对象中。
一个用于文档的惰性加载器。
load
()加载文档。
load_and_split
([text_splitter])加载文档并分割成块。块作为文档返回。
- Parameters
path (Union[str, Path]) –
include_outputs (bool) –
max_output_length (int) –
remove_newline (bool) –
traceback (bool) –
- __init__(path: Union[str, Path], include_outputs: bool = False, max_output_length: int = 10, remove_newline: bool = False, traceback: bool = False)[source]¶
使用路径进行初始化。
- 参数:
path: 从中加载笔记本的路径。 include_outputs: 是否包括单元格的输出。
默认为False。
- max_output_length: 要显示的输出的最大长度。
默认为10。
- remove_newline: 是否从笔记本中删除换行符。
默认为False。
- traceback: 是否返回错误的回溯信息。
默认为False。
- Parameters
path (Union[str, Path]) –
include_outputs (bool) –
max_output_length (int) –
remove_newline (bool) –
traceback (bool) –
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并分割成块。块作为文档返回。
不要覆盖此方法。应该被视为已弃用!
- 参数:
- text_splitter: 用于分割文档的TextSplitter实例。
默认为RecursiveCharacterTextSplitter。
- 返回:
文档列表。
- Parameters
text_splitter (Optional[TextSplitter]) –
- Return type
List[Document]