示例

请参阅以下涵盖txtai的全面示例笔记本和应用程序系列。

语义搜索

构建语义/相似性/向量/神经搜索应用程序。

LLM链、检索增强生成（RAG）、与您的数据聊天、与大型语言模型（LLMs）接口的管道和工作流。

笔记本	描述
基于提示的大语言模型驱动搜索	嵌入引导和提示驱动的大语言模型（LLMs）搜索
提示模板与任务链	构建模型提示并通过工作流连接任务
使用txtai构建RAG管道	检索增强生成的指南，包括如何创建引用
集成LLM框架	集成llama.cpp、LiteLLM和自定义生成框架
使用语义图和RAG生成知识	使用语义图和RAG进行知识探索和发现
使用LLM构建知识图谱	使用LLM驱动的实体提取构建知识图谱
使用图路径遍历的高级RAG	图路径遍历以收集复杂数据集用于高级RAG
使用引导生成的高级RAG	检索增强和引导生成
使用llama.cpp和外部API服务的RAG	使用额外的向量和LLM框架的RAG
txtai如何实现RAG	创建RAG流程、API服务和Docker实例
语音到语音的RAG ▶️	使用RAG的完整语音到语音工作流程

使用语言模型支持的管道转换数据。

高效地大规模处理数据。

训练 NLP 模型。

笔记本	描述
训练文本标签器	构建文本序列分类模型
无标签训练	使用零样本分类器训练新模型
训练问答模型	构建和微调问答模型
从头开始训练语言模型	构建新的语言模型
使用 ONNX 导出和运行模型	使用 ONNX 导出模型，在 JavaScript、Java 和 Rust 中本地运行
导出和运行其他机器学习模型	从 scikit-learn、PyTorch 等导出和运行模型

运行分布式 txtai，与 API 和云端点集成。

笔记本	描述
API 画廊	在 JavaScript、Java、Rust 和 Go 中使用 txtai
分布式嵌入集群	将嵌入索引分布在多个数据节点上
云端嵌入	从 Hugging Face Hub 加载并使用嵌入索引
自定义 API 端点	通过自定义端点扩展 API
API 授权与认证	为 API 添加授权、认证和中件间依赖

项目架构、数据格式、外部集成、生产规模、基准测试和性能。

笔记本	描述
txtai 索引剖析	深入了解 txtai 嵌入索引背后的文件格式
嵌入组件	通过向量、SQL 和评分组件实现可组合搜索
定制你自己的嵌入数据库	将向量索引与关系数据库结合的方法
在 Python 中构建高效的稀疏关键词索引	快速且准确的稀疏关键词索引
混合搜索的好处	通过语义和关键词搜索的结合提高准确性
外部数据库集成	在 PostgreSQL、MariaDB、MySQL 等中存储元数据
关于向量量化的全部	标量和乘积量化方法的基准测试
外部向量化	使用预计算的嵌入数据集和API进行向量化
将txtai与Postgres集成	在Postgres中持久化内容、向量和图数据
开放数据访问的嵌入索引格式	平台和编程语言无关的数据存储与txtai

主要版本中新增的功能。

一系列使用txtai的示例应用。还提供了Hugging Face Spaces上的托管版本链接（如果有）。

应用	描述
基本相似性搜索	基本相似性搜索示例。数据来自最初的txtai演示。	🤗
棒球统计	使用向量搜索匹配历史棒球球员统计数据。	🤗
基准测试	计算BEIR数据集的性能指标。	仅本地运行
书籍搜索	书籍相似性搜索应用。索引书籍描述并使用自然语言语句进行查询。	仅本地运行
图像搜索	图像相似性搜索应用。索引图像目录并运行搜索以识别与输入查询相似的图像。	🤗
检索增强生成	使用txtai嵌入数据库的RAG。提出问题并从受上下文约束的LLM中获取答案。	仅本地运行
总结文章	总结文章。从网页中提取文本并构建摘要的工作流程。	🤗
维基搜索	维基百科搜索应用。查询维基百科API并总结最佳结果。	🤗
工作流构建器	构建和执行txtai工作流。将摘要、文本提取、转录、翻译和相似性搜索管道连接在一起，运行统一的工作流。	🤗