`langchain_text_splitters.markdown`.MarkdownHeaderTextSplitter¶

class langchain_text_splitters.markdown.MarkdownHeaderTextSplitter(headers_to_split_on: List[Tuple[str, str]], return_each_line: bool = False, strip_headers: bool = True)[source]¶

根据指定的标题拆分Markdown文件。

创建一个新的MarkdownHeaderTextSplitter。

参数：: headers_to_split_on: 我们想要跟踪的标题 return_each_line: 返回每行与相关标题 strip_headers: 从块的内容中剥离分割的标题

Methods

`__init__`(headers_to_split_on[, ...])	创建一个新的MarkdownHeaderTextSplitter。
`aggregate_lines_to_chunks`(lines)	将具有相同元数据的行组合成块参数： lines：文本行/相关的头部元数据
`split_text`(text)	分割 markdown 文件参数： text: Markdown 文件

Parameters

headers_to_split_on (List[Tuple[str, str]]) –
return_each_line (bool) –
strip_headers (bool) –

__init__(headers_to_split_on: List[Tuple[str, str]], return_each_line: bool = False, strip_headers: bool = True)[source]¶

创建一个新的MarkdownHeaderTextSplitter。

参数：: headers_to_split_on: 我们想要跟踪的标题 return_each_line: 返回每行与相关标题 strip_headers: 从块的内容中剥离分割的标题

Parameters

headers_to_split_on (List[Tuple[str, str]]) –
return_each_line (bool) –
strip_headers (bool) –

aggregate_lines_to_chunks(lines: List[LineType]) → List[Document][source]¶

将具有相同元数据的行组合成块参数：

lines：文本行/相关的头部元数据

Parameters: lines (List[LineType]) –
Return type: List[Document]

split_text(text: str) → List[Document][source]¶

分割 markdown 文件参数：

text: Markdown 文件

Parameters: text (str) –
Return type: List[Document]

Examples using MarkdownHeaderTextSplitter¶

MD splits

langchain_text_splitters.markdown.MarkdownHeaderTextSplitter¶

Examples using MarkdownHeaderTextSplitter¶

`langchain_text_splitters.markdown`.MarkdownHeaderTextSplitter¶