OpenAIWhisperParser#

class langchain_community.document_loaders.parsers.audio.OpenAIWhisperParser(api_key: str | None = None, *, chunk_duration_threshold: float = 0.1, base_url: str | None = None, language: str | None = None, prompt: str | None = None, response_format: Literal['json', 'text', 'srt', 'verbose_json', 'vtt'] | None = None, temperature: float | None = None)[来源]#

转录和解析音频文件。

音频转录使用的是OpenAI Whisper模型。

Parameters:
  • api_key (str | None) – OpenAI API 密钥

  • chunk_duration_threshold (float) – 块的最小持续时间,单位为秒 注意:根据OpenAI API,块的持续时间应至少为0.1秒。如果块的持续时间小于或等于阈值,则将被跳过。

  • base_url (str | None)

  • 语言 (str | )

  • prompt (str | None)

  • response_format (Literal['json', 'text', 'srt', 'verbose_json', 'vtt'] | None)

  • temperature (float | None)

方法

__init__([api_key, ...])

lazy_parse(blob)

懒解析 blob。

parse(blob)

急切地将blob解析为一个或多个文档。

__init__(api_key: str | None = None, *, chunk_duration_threshold: float = 0.1, base_url: str | None = None, language: str | None = None, prompt: str | None = None, response_format: Literal['json', 'text', 'srt', 'verbose_json', 'vtt'] | None = None, temperature: float | None = None)[source]#
Parameters:
  • api_key (str | None)

  • chunk_duration_threshold (float)

  • base_url (str | None)

  • 语言 (str | )

  • prompt (str | None)

  • response_format (Literal['json', 'text', 'srt', 'verbose_json', 'vtt'] | None)

  • temperature (float | None)

lazy_parse(blob: Blob) Iterator[Document][source]#

懒解析blob。

Parameters:

blob (Blob)

Return type:

迭代器[文档]

parse(blob: Blob) list[Document]#

急切地将blob解析为一个或多个文档。

这是一个用于交互式开发环境的便捷方法。

生产应用程序应优先使用lazy_parse方法。

子类通常不应重写此解析方法。

Parameters:

blob (Blob) – Blob 实例

Returns:

文档列表

Return type:

列表[Document]

使用 OpenAIWhisperParser 的示例