langchain_community.document_loaders.parsers.audio.OpenAIWhisperParser

class langchain_community.document_loaders.parsers.audio.OpenAIWhisperParser(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[source]

转录和解析音频文件。

音频转录使用OpenAI Whisper模型。

参数:

api_key: OpenAI API密钥 chunk_duration_threshold: 分块的最小持续时间(秒)

注意:根据OpenAI API的规定,分块持续时间至少应为0.1秒。 如果分块持续时间小于或等于阈值,则会被跳过。

Methods

__init__([api_key, ...])

lazy_parse(blob)

懒惰地解析blob。

parse(blob)

将blob急切地解析为一个文档或多个文档。

Parameters
  • api_key (Optional[str]) –

  • chunk_duration_threshold (float) –

  • base_url (Optional[str]) –

  • language (Optional[str]) –

  • prompt (Optional[str]) –

  • response_format (Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']]) –

  • temperature (Optional[float]) –

__init__(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[source]
Parameters
  • api_key (Optional[str]) –

  • chunk_duration_threshold (float) –

  • base_url (Optional[str]) –

  • language (Optional[str]) –

  • prompt (Optional[str]) –

  • response_format (Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']]) –

  • temperature (Optional[float]) –

lazy_parse(blob: Blob) Iterator[Document][source]

懒惰地解析blob。

Parameters

blob (Blob) –

Return type

Iterator[Document]

parse(blob: Blob) List[Document]

将blob急切地解析为一个文档或多个文档。

这是一个用于交互式开发环境的便利方法。

生产应用程序应该更倾向于使用lazy_parse方法。

子类通常不应该覆盖这个解析方法。

参数:

blob:Blob实例

返回:

文档列表

Parameters

blob (Blob) –

Return type

List[Document]

Examples using OpenAIWhisperParser