langchain_text_splitters.markdown
.MarkdownHeaderTextSplitter¶
- class langchain_text_splitters.markdown.MarkdownHeaderTextSplitter(headers_to_split_on: List[Tuple[str, str]], return_each_line: bool = False, strip_headers: bool = True)[source]¶
根据指定的标题拆分Markdown文件。
创建一个新的MarkdownHeaderTextSplitter。
- 参数:
headers_to_split_on: 我们想要跟踪的标题 return_each_line: 返回每行与相关标题 strip_headers: 从块的内容中剥离分割的标题
Methods
__init__
(headers_to_split_on[, ...])创建一个新的MarkdownHeaderTextSplitter。
aggregate_lines_to_chunks
(lines)将具有相同元数据的行组合成块 参数: lines:文本行/相关的头部元数据
split_text
(text)分割 markdown 文件 参数: text: Markdown 文件
- Parameters
headers_to_split_on (List[Tuple[str, str]]) –
return_each_line (bool) –
strip_headers (bool) –
- __init__(headers_to_split_on: List[Tuple[str, str]], return_each_line: bool = False, strip_headers: bool = True)[source]¶
创建一个新的MarkdownHeaderTextSplitter。
- 参数:
headers_to_split_on: 我们想要跟踪的标题 return_each_line: 返回每行与相关标题 strip_headers: 从块的内容中剥离分割的标题
- Parameters
headers_to_split_on (List[Tuple[str, str]]) –
return_each_line (bool) –
strip_headers (bool) –