跳到主要内容

音频相似度搜索

本教程演示了如何使用开源向量数据库 Milvus 构建音频相似度搜索系统。

本教程使用的机器学习模型和第三方软件包括:

  • PANNs(大规模预训练音频神经网络)
  • MySQL
  • Towhee

语音、音乐、音效等各种类型的音频搜索使得可以快速查询大量音频数据并呈现相似声音。音频相似度搜索系统的应用包括识别相似音效、减少知识产权侵权等。音频检索可用于实时搜索和监控在线媒体,以打击知识产权侵权行为。它还在音频数据的分类和统计分析中扮演重要角色。

在本教程中,您将学习如何构建一个音频相似度搜索系统,可以返回相似的音频片段。上传的音频片段使用 PANNs 转换为向量。这些向量存储在 Milvus 中,Milvus 会自动生成每个向量的唯一 ID。然后用户可以在 Milvus 中进行向量相似度搜索,并查询与 Milvus 返回的唯一向量 ID 对应的音频片段数据路径。

音频搜索 音频搜索演示