langchain_community.document_loaders.parsers.audio.YandexSTTParser

class langchain_community.document_loaders.parsers.audio.YandexSTTParser(*, api_key: Optional[str] = None, iam_token: Optional[str] = None, model: str = 'general', language: str = 'auto')[source]

转录和解析音频文件。 音频转录使用OpenAI Whisper模型。

初始化解析器。

参数:

api_key:用于服务帐户的API密钥,具有`ai.speechkit-stt.user`角色。 iam_token:用于服务帐户的IAM令牌,具有`ai.speechkit-stt.user`角色。 model:识别模型名称。

默认为通用模型。

language:以ISO 639-1格式表示的语言。

默认为自动语言识别。

必须提供`api_key`或`iam_token`,但不能同时提供。

Methods

__init__(*[, api_key, iam_token, model, ...])

初始化解析器。

lazy_parse(blob)

懒惰地解析blob。

parse(blob)

将blob急切地解析为一个文档或多个文档。

Parameters
  • api_key (Optional[str]) –

  • iam_token (Optional[str]) –

  • model (str) –

  • language (str) –

__init__(*, api_key: Optional[str] = None, iam_token: Optional[str] = None, model: str = 'general', language: str = 'auto')[source]

初始化解析器。

参数:

api_key:用于服务帐户的API密钥,具有`ai.speechkit-stt.user`角色。 iam_token:用于服务帐户的IAM令牌,具有`ai.speechkit-stt.user`角色。 model:识别模型名称。

默认为通用模型。

language:以ISO 639-1格式表示的语言。

默认为自动语言识别。

必须提供`api_key`或`iam_token`,但不能同时提供。

Parameters
  • api_key (Optional[str]) –

  • iam_token (Optional[str]) –

  • model (str) –

  • language (str) –

lazy_parse(blob: Blob) Iterator[Document][source]

懒惰地解析blob。

Parameters

blob (Blob) –

Return type

Iterator[Document]

parse(blob: Blob) List[Document]

将blob急切地解析为一个文档或多个文档。

这是一个用于交互式开发环境的便利方法。

生产应用程序应该更倾向于使用lazy_parse方法。

子类通常不应该覆盖这个解析方法。

参数:

blob:Blob实例

返回:

文档列表

Parameters

blob (Blob) –

Return type

List[Document]