langchain_community.document_loaders.parsers.audio
.OpenAIWhisperParser¶
- class langchain_community.document_loaders.parsers.audio.OpenAIWhisperParser(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[source]¶
转录和解析音频文件。
音频转录使用OpenAI Whisper模型。
- 参数:
api_key: OpenAI API密钥 chunk_duration_threshold: 分块的最小持续时间(秒)
注意:根据OpenAI API的规定,分块持续时间至少应为0.1秒。 如果分块持续时间小于或等于阈值,则会被跳过。
Methods
__init__
([api_key, ...])lazy_parse
(blob)懒惰地解析blob。
parse
(blob)将blob急切地解析为一个文档或多个文档。
- Parameters
api_key (Optional[str]) –
chunk_duration_threshold (float) –
base_url (Optional[str]) –
language (Optional[str]) –
prompt (Optional[str]) –
response_format (Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']]) –
temperature (Optional[float]) –
- __init__(api_key: Optional[str] = None, *, chunk_duration_threshold: float = 0.1, base_url: Optional[str] = None, language: Optional[str] = None, prompt: Optional[str] = None, response_format: Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']] = None, temperature: Optional[float] = None)[source]¶
- Parameters
api_key (Optional[str]) –
chunk_duration_threshold (float) –
base_url (Optional[str]) –
language (Optional[str]) –
prompt (Optional[str]) –
response_format (Optional[Literal['json', 'text', 'srt', 'verbose_json', 'vtt']]) –
temperature (Optional[float]) –