处理转录拼写错误:提示 vs 后处理
我们正在解决提高转录准确性的问题,特别是在涉及公司名称和产品引用时。我们的解决方案涉及使用Whisper提示参数和GPT-4的后处理能力的双重策略。
纠正不准确性的两种方法是:
-
我们直接将正确拼写的列表输入Whisper的提示参数,以指导初始转录。
-
我们利用GPT-4在转录后修复拼写错误,再次使用相同的正确拼写列表在提示中。
这些策略旨在确保对不熟悉的专有名词进行精确转录。
设置
要开始,请:
- 导入OpenAI Python库(如果没有,请使用
pip install openai
进行安装) - 下载音频文件示例
# 导入
from openai import OpenAI # 用于进行OpenAI API调用
import urllib # 用于下载示例音频文件
import os # 用于访问环境变量
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY", "<your OpenAI API key if not set as env var>"))
# 设置下载路径
ZyntriQix_remote_filepath = "https://cdn.openai.com/API/examples/data/ZyntriQix.wav"
# 设置本地保存位置
ZyntriQix_filepath = "data/ZyntriQix.wav"
# 下载示例音频文件并保存到本地
urllib.request.urlretrieve(ZyntriQix_remote_filepath, ZyntriQix_filepath)
('data/ZyntriQix.wav', <http.client.HTTPMessage at 0x10559a910>)