YandexSTTParser#

class langchain_community.document_loaders.parsers.audio.YandexSTTParser(*, api_key: str | None = None, iam_token: str | None = None, model: str = 'general', language: str = 'auto')[source]#

转录和解析音频文件。 音频转录使用OpenAI Whisper模型。

初始化解析器。

Parameters:
  • api_key (str | None) – 服务账户的API密钥

  • role. (与 ai.speechkit-stt.user)

  • iam_token (str | None) – 服务账户的IAM令牌

  • 角色。

  • model (str) – 识别模型名称。默认为 general。

  • language (str) – 语言,采用ISO 639-1格式。默认为自动语言识别。

必须提供api_keyiam_token,但不能同时提供两者。

方法

__init__(*[, api_key, iam_token, model, ...])

初始化解析器。

lazy_parse(blob)

懒解析 blob。

parse(blob)

急切地将blob解析为一个或多个文档。

__init__(*, api_key: str | None = None, iam_token: str | None = None, model: str = 'general', language: str = 'auto')[source]#

初始化解析器。

Parameters:
  • api_key (str | None) – 服务账户的API密钥

  • role. (与 ai.speechkit-stt.user)

  • iam_token (str | None) – 服务账户的IAM令牌

  • 角色。

  • model (str) – 识别模型名称。默认为 general。

  • language (str) – 语言,采用ISO 639-1格式。默认为自动语言识别。

必须提供api_keyiam_token,但不能同时提供两者。

lazy_parse(blob: Blob) Iterator[Document][source]#

懒解析blob。

Parameters:

blob (Blob)

Return type:

迭代器[文档]

parse(blob: Blob) list[Document]#

急切地将blob解析为一个或多个文档。

这是一个用于交互式开发环境的便捷方法。

生产应用程序应优先使用lazy_parse方法。

子类通常不应重写此解析方法。

Parameters:

blob (Blob) – Blob 实例

Returns:

文档列表

Return type:

列表[Document]