Skip to content

配置

以下描述了可用的嵌入配置。这些参数通过 config 参数或作为关键字参数在 Embeddings 构造函数 中设置。

配置设计为可选的,仅在需要时设置。开箱即用,会选择合理的默认值以快速启动和运行。例如:

from txtai import Embeddings

embeddings = Embeddings()

创建一个新的嵌入实例,使用 all-MiniLM-L6-v2 作为向量模型,Faiss 作为 ANN 索引后端,并且禁用内容存储。

from txtai import Embeddings

embeddings = Embeddings(content=True)

与上述相同,只是它添加了 SQLite 用于内容存储。

以下部分链接了所有可用的配置选项。

ANN

默认的向量索引后端是 Faiss。

Cloud

嵌入数据库可以选择与云存储同步。

Database

默认情况下禁用内容存储。启用时,SQLite 是默认的存储引擎。

General

不适合其他地方的通用配置。

Graph

可以创建一个伴随的图索引与嵌入数据库一起使用。这启用了主题建模、路径遍历等功能。NetworkX 是默认的图索引。

Scoring

稀疏关键词索引和词向量术语加权。

Vectors

通过将文本和其他二进制数据转换为嵌入向量来启用向量搜索。这些向量随后存储在 ANN 索引中。向量模型是可选的,当未提供时使用默认模型。