解析Oracle文档元数据#

class langchain_community.document_loaders.oracleai.ParseOracleDocMetadata[source]#

解析Oracle文档元数据…

初始化并重置此实例。

如果 convert_charrefs 为 True(默认值),所有字符引用将自动转换为相应的 Unicode 字符。

属性

CDATA_CONTENT_ELEMENTS

方法

__init__()

初始化和重置此实例。

check_for_whole_start_tag(i)

clear_cdata_mode()

close()

处理任何缓冲的数据。

feed(data)

将数据提供给解析器。

get_metadata()

get_starttag_text()

返回开始标签的完整源代码:'<...>'。

getpos()

返回当前行号和偏移量。

goahead(end)

handle_charref(name)

handle_comment(data)

handle_data(data)

handle_decl(decl)

handle_endtag(tag)

handle_entityref(name)

handle_pi(data)

handle_startendtag(tag, attrs)

handle_starttag(tag, attrs)

parse_bogus_comment(i[, report])

parse_comment(i[, report])

parse_declaration(i)

parse_endtag(i)

parse_html_declaration(i)

parse_marked_section(i[, report])

parse_pi(i)

parse_starttag(i)

reset()

重置此实例。

set_cdata_mode(elem)

unknown_decl(data)

updatepos(i, j)

__init__() None[来源]#

初始化并重置此实例。

如果 convert_charrefs 为 True(默认值),所有字符引用将自动转换为相应的 Unicode 字符。

Return type:

check_for_whole_start_tag(i)#
clear_cdata_mode()#
close()#

处理任何缓冲的数据。

feed(data)#

将数据提供给解析器。

根据需要随时调用此函数,可以包含任意多或任意少的文本(可能包括‘n’)。

get_metadata() Dict[str, Any][来源]#
Return type:

Dict[str, Any]

get_starttag_text()#

返回开始标签的完整源代码:‘<…>’。

getpos()#

返回当前行号和偏移量。

goahead(end)#
handle_charref(name)#
handle_comment(data)#
handle_data(data: str) None[来源]#
Parameters:

数据 (字符串)

Return type:

handle_decl(decl)#
handle_endtag(tag)#
handle_entityref(name)#
handle_pi(data)#
handle_startendtag(tag, attrs)#
handle_starttag(tag: str, attrs: List[Tuple[str, str | None]]) None[source]#
Parameters:
  • 标签 (字符串)

  • attrs (列表[元组[字符串, 字符串 | ]])

Return type:

parse_bogus_comment(i, report=1)#
parse_comment(i, report=1)#
parse_declaration(i)#
parse_endtag(i)#
parse_html_declaration(i)#
parse_marked_section(i, report=1)#
parse_pi(i)#
parse_starttag(i)#
reset()#

重置此实例。丢失所有未处理的数据。

set_cdata_mode(elem)#
unknown_decl(data)#
updatepos(i, j)#