langchain_text_splitters.markdown.MarkdownHeaderTextSplitter

class langchain_text_splitters.markdown.MarkdownHeaderTextSplitter(headers_to_split_on: List[Tuple[str, str]], return_each_line: bool = False, strip_headers: bool = True)[source]

根据指定的标题拆分Markdown文件。

创建一个新的MarkdownHeaderTextSplitter。

参数:

headers_to_split_on: 我们想要跟踪的标题 return_each_line: 返回每行与相关标题 strip_headers: 从块的内容中剥离分割的标题

Methods

__init__(headers_to_split_on[, ...])

创建一个新的MarkdownHeaderTextSplitter。

aggregate_lines_to_chunks(lines)

将具有相同元数据的行组合成块 参数: lines:文本行/相关的头部元数据

split_text(text)

分割 markdown 文件 参数: text: Markdown 文件

Parameters
  • headers_to_split_on (List[Tuple[str, str]]) –

  • return_each_line (bool) –

  • strip_headers (bool) –

__init__(headers_to_split_on: List[Tuple[str, str]], return_each_line: bool = False, strip_headers: bool = True)[source]

创建一个新的MarkdownHeaderTextSplitter。

参数:

headers_to_split_on: 我们想要跟踪的标题 return_each_line: 返回每行与相关标题 strip_headers: 从块的内容中剥离分割的标题

Parameters
  • headers_to_split_on (List[Tuple[str, str]]) –

  • return_each_line (bool) –

  • strip_headers (bool) –

aggregate_lines_to_chunks(lines: List[LineType]) List[Document][source]

将具有相同元数据的行组合成块 参数:

lines:文本行/相关的头部元数据

Parameters

lines (List[LineType]) –

Return type

List[Document]

split_text(text: str) List[Document][source]

分割 markdown 文件 参数:

text: Markdown 文件

Parameters

text (str) –

Return type

List[Document]

Examples using MarkdownHeaderTextSplitter