AzureAIDocumentIntelligenceParser#

class langchain_community.document_loaders.parsers.doc_intelligence.AzureAIDocumentIntelligenceParser(api_endpoint: str, api_key: str, api_version: str | None = None, api_model: str = 'prebuilt-layout', mode: str = 'markdown', analysis_features: List[str] | None = None)[来源]#

使用Azure文档智能(以前称为表单识别器)加载PDF。

方法

__init__(api_endpoint, api_key[, ...])

lazy_parse(blob)

懒解析 blob。

parse(blob)

急切地将blob解析为一个或多个文档。

parse_bytes(bytes_source)

parse_url(url)

Parameters:
  • api_endpoint (str)

  • api_key (str)

  • api_version (str | None)

  • api_model (str)

  • mode (str)

  • analysis_features (List[str] | None)

__init__(api_endpoint: str, api_key: str, api_version: str | None = None, api_model: str = 'prebuilt-layout', mode: str = 'markdown', analysis_features: List[str] | None = None)[来源]#
Parameters:
  • api_endpoint (str)

  • api_key (str)

  • api_version (str | None)

  • api_model (str)

  • mode (str)

  • analysis_features (List[str] | None)

lazy_parse(blob: Blob) Iterator[Document][source]#

懒解析blob。

Parameters:

blob (Blob)

Return type:

迭代器[文档]

parse(blob: Blob) list[Document]#

急切地将blob解析为一个或多个文档。

这是一个用于交互式开发环境的便捷方法。

生产应用程序应优先使用lazy_parse方法。

子类通常不应重写此解析方法。

Parameters:

blob (Blob) – Blob 实例

Returns:

文档列表

Return type:

列表[Document]

parse_bytes(bytes_source: bytes) Iterator[Document][来源]#
Parameters:

bytes_source (字节)

Return type:

迭代器[文档]

parse_url(url: str) Iterator[Document][source]#
Parameters:

url (str)

Return type:

迭代器[文档]