标签解析器#
- class langchain_experimental.llms.anthropic_functions.TagParser[source]#
工具标签的解析器。
一个粗暴的解决方案,但对于原型设计来说很快。
可能会在以后重新实现,以将范围限制在有限的语法内,并提高效率。
使用HTML解析器来解析一种有限的语法,该语法允许以下形式的语法:
输入 -> 垃圾? 值* 垃圾 -> 垃圾字符+ 垃圾字符 -> 空白 | , 值 -> <标识符>数据 | 对象 对象 -> <标识符>值+ 标识符 -> [a-Z][a-Z0-9_]* 数据 -> .*
解释数据以允许标签的重复和递归,以支持复杂类型的表示。
^ 只是另一个大致错误的语法规范。
属性
CDATA_CONTENT_ELEMENTS
方法
__init__
()一个粗暴的解决方案,但对于原型设计来说很快。
close
()处理任何缓冲的数据。
feed
(data)向解析器提供数据。
返回开始标签的完整源代码:'<...>'。
getpos
()返回当前行号和偏移量。
goahead
(end)handle_charref
(name)handle_comment
(data)handle_data
(data)处理数据时的钩子。
handle_decl
(decl)handle_endtag
(tag)当标签关闭时的钩子。
handle_entityref
(name)handle_pi
(data)handle_startendtag
(tag, attrs)handle_starttag
(tag, attrs)当遇到新标签时的钩子。
parse_bogus_comment
(i[, report])parse_comment
(i[, report])parse_endtag
(i)parse_marked_section
(i[, report])parse_pi
(i)reset
()重置此实例。
set_cdata_mode
(elem)unknown_decl
(data)updatepos
(i, j)- __init__() None [源代码]#
一个粗暴的解决方案,但对于原型设计来说很快。
可能会在以后重新实现,以将范围限制在有限的语法内,并提高效率。
使用HTML解析器来解析一种有限的语法,该语法允许以下形式的语法:
输入 -> 垃圾? 值* 垃圾 -> 垃圾字符+ 垃圾字符 -> 空白 | , 值 -> <标识符>数据 | 对象 对象 -> <标识符>值+ 标识符 -> [a-Z][a-Z0-9_]* 数据 -> .*
解释数据以允许标签的重复和递归,以支持复杂类型的表示。
^ 只是另一个大致错误的语法规范。
- Return type:
无
- check_for_whole_start_tag(i)#
- clear_cdata_mode()#
- close()#
处理任何缓冲的数据。
- feed(data)#
将数据提供给解析器。
根据需要随时调用此函数,可以包含任意多或任意少的文本(可能包括‘n’)。
- get_starttag_text()#
返回开始标签的完整源代码:‘<…>’。
- getpos()#
返回当前行号和偏移量。
- goahead(end)#
- handle_charref(name)#
- handle_comment(data)#
- handle_decl(decl)#
- handle_entityref(name)#
- handle_pi(data)#
- handle_startendtag(tag, attrs)#
- handle_starttag(tag: str, attrs: Any) None [来源]#
当遇到新标签时的钩子。
- Parameters:
标签 (字符串)
attrs (Any)
- Return type:
无
- parse_bogus_comment(i, report=1)#
- parse_comment(i, report=1)#
- parse_declaration(i)#
- parse_endtag(i)#
- parse_html_declaration(i)#
- parse_marked_section(i, report=1)#
- parse_pi(i)#
- parse_starttag(i)#
- reset()#
重置此实例。丢失所有未处理的数据。
- set_cdata_mode(elem)#
- unknown_decl(data)#
- updatepos(i, j)#