标签解析器#

class langchain_experimental.llms.anthropic_functions.TagParser[source]#

工具标签的解析器。

一个粗暴的解决方案,但对于原型设计来说很快。

可能会在以后重新实现,以将范围限制在有限的语法内,并提高效率。

使用HTML解析器来解析一种有限的语法,该语法允许以下形式的语法:

输入 -> 垃圾? 值* 垃圾 -> 垃圾字符+ 垃圾字符 -> 空白 | , 值 -> <标识符>数据 | 对象 对象 -> <标识符>值+ 标识符 -> [a-Z][a-Z0-9_]* 数据 -> .*

解释数据以允许标签的重复和递归,以支持复杂类型的表示。

^ 只是另一个大致错误的语法规范。

属性

CDATA_CONTENT_ELEMENTS

方法

__init__()

一个粗暴的解决方案,但对于原型设计来说很快。

check_for_whole_start_tag(i)

clear_cdata_mode()

close()

处理任何缓冲的数据。

feed(data)

向解析器提供数据。

get_starttag_text()

返回开始标签的完整源代码:'<...>'。

getpos()

返回当前行号和偏移量。

goahead(end)

handle_charref(name)

handle_comment(data)

handle_data(data)

处理数据时的钩子。

handle_decl(decl)

handle_endtag(tag)

当标签关闭时的钩子。

handle_entityref(name)

handle_pi(data)

handle_startendtag(tag, attrs)

handle_starttag(tag, attrs)

当遇到新标签时的钩子。

parse_bogus_comment(i[, report])

parse_comment(i[, report])

parse_declaration(i)

parse_endtag(i)

parse_html_declaration(i)

parse_marked_section(i[, report])

parse_pi(i)

parse_starttag(i)

reset()

重置此实例。

set_cdata_mode(elem)

unknown_decl(data)

updatepos(i, j)

__init__() None[源代码]#

一个粗暴的解决方案,但对于原型设计来说很快。

可能会在以后重新实现,以将范围限制在有限的语法内,并提高效率。

使用HTML解析器来解析一种有限的语法,该语法允许以下形式的语法:

输入 -> 垃圾? 值* 垃圾 -> 垃圾字符+ 垃圾字符 -> 空白 | , 值 -> <标识符>数据 | 对象 对象 -> <标识符>值+ 标识符 -> [a-Z][a-Z0-9_]* 数据 -> .*

解释数据以允许标签的重复和递归,以支持复杂类型的表示。

^ 只是另一个大致错误的语法规范。

Return type:

check_for_whole_start_tag(i)#
clear_cdata_mode()#
close()#

处理任何缓冲的数据。

feed(data)#

将数据提供给解析器。

根据需要随时调用此函数,可以包含任意多或任意少的文本(可能包括‘n’)。

get_starttag_text()#

返回开始标签的完整源代码:‘<…>’。

getpos()#

返回当前行号和偏移量。

goahead(end)#
handle_charref(name)#
handle_comment(data)#
handle_data(data: str) None[源代码]#

处理数据时的钩子。

Parameters:

数据 (字符串)

Return type:

handle_decl(decl)#
handle_endtag(tag: str) None[源代码]#

当标签关闭时的钩子。

Parameters:

标签 (字符串)

Return type:

handle_entityref(name)#
handle_pi(data)#
handle_startendtag(tag, attrs)#
handle_starttag(tag: str, attrs: Any) None[来源]#

当遇到新标签时的钩子。

Parameters:
  • 标签 (字符串)

  • attrs (Any)

Return type:

parse_bogus_comment(i, report=1)#
parse_comment(i, report=1)#
parse_declaration(i)#
parse_endtag(i)#
parse_html_declaration(i)#
parse_marked_section(i, report=1)#
parse_pi(i)#
parse_starttag(i)#
reset()#

重置此实例。丢失所有未处理的数据。

set_cdata_mode(elem)#
unknown_decl(data)#
updatepos(i, j)#