langchain_text_splitters
0.2.0¶
langchain_text_splitters.base
¶
Classes¶
|
编程语言的枚举。 |
|
文本分割接口。 |
|
使用模型分词器将文本拆分为标记。 |
|
分词器数据类。 |
Functions¶
|
分割传入的文本并使用标记器返回块。 |
langchain_text_splitters.character
¶
Classes¶
|
分割查看字符的文本。 |
通过递归查看字符来拆分文本。 |
langchain_text_splitters.html
¶
Classes¶
元素类型为类型字典。 |
|
|
根据指定的标题拆分HTML文件。 需要lxml包。 |
|
根据指定的标签和字体大小拆分HTML文件。 需要lxml包。 |
langchain_text_splitters.json
¶
Classes¶
|
langchain_text_splitters.konlpy
¶
Classes¶
|
使用Konlpy包来分割文本。 |
langchain_text_splitters.latex
¶
Classes¶
|
尝试沿着Latex格式的布局元素拆分文本。 |
langchain_text_splitters.markdown
¶
Classes¶
标头类型,作为类型字典。 |
|
行类型,作为类型字典。 |
|
|
根据指定的标题拆分Markdown文件。 |
|
尝试沿着Markdown格式的标题拆分文本。 |
langchain_text_splitters.nltk
¶
Classes¶
|
使用NLTK包分割文本。 |
langchain_text_splitters.python
¶
Classes¶
|
尝试沿着Python语法拆分文本。 |
langchain_text_splitters.sentence_transformers
¶
Classes¶
|
使用句子模型分词器将文本拆分为标记。 |
langchain_text_splitters.spacy
¶
Classes¶
|
使用Spacy包来分割文本。 |