配置
以下描述了可用的嵌入配置。这些参数通过 config
参数或作为关键字参数在 Embeddings 构造函数 中设置。
配置设计为可选的,仅在需要时设置。开箱即用,会选择合理的默认值以快速启动和运行。例如:
from txtai import Embeddings
embeddings = Embeddings()
创建一个新的嵌入实例,使用 all-MiniLM-L6-v2 作为向量模型,Faiss 作为 ANN 索引后端,并且禁用内容存储。
from txtai import Embeddings
embeddings = Embeddings(content=True)
与上述相同,只是它添加了 SQLite 用于内容存储。
以下部分链接了所有可用的配置选项。
ANN
默认的向量索引后端是 Faiss。
Cloud
嵌入数据库可以选择与云存储同步。
Database
默认情况下禁用内容存储。启用时,SQLite 是默认的存储引擎。
General
不适合其他地方的通用配置。
Graph
可以创建一个伴随的图索引与嵌入数据库一起使用。这启用了主题建模、路径遍历等功能。NetworkX 是默认的图索引。
Scoring
稀疏关键词索引和词向量术语加权。
Vectors
通过将文本和其他二进制数据转换为嵌入向量来启用向量搜索。这些向量随后存储在 ANN 索引中。向量模型是可选的,当未提供时使用默认模型。