Skip to content
Ragas
指标
Initializing search
explodinggradients/ragas
🚀 快速开始
📚 核心概念
🛠️ 操作指南
📖 参考资料
❤️ 社区
Ragas
explodinggradients/ragas
🚀 快速开始
🚀 快速开始
安装
使用指标进行评估
为RAG生成合成测试集
📚 核心概念
📚 核心概念
组件
组件
通用
通用
提示
评估
评估
评估样本
评估数据集
指标
指标
概述
可用指标
可用指标
检索增强生成
检索增强生成
上下文精度
上下文召回率
上下文实体召回率
噪声敏感性
响应相关性
真实度
代理或工具使用案例
代理或工具使用案例
代理或工具使用
主题遵从性
工具调用准确性
代理目标准确性
自然语言比较
自然语言比较
事实正确性
语义相似度
传统非LLM指标
传统非LLM指标
传统NLP指标
非LLM字符串相似度
BLEU分数
ROUGE分数
字符串存在
精确匹配
SQL
SQL
SQL
基于执行的Datacompy分数
SQL查询等价性
通用
通用
通用评估指标
方面评论家
简单标准评分
基于评分标准评分
实例特定评分标准评分
其他任务
其他任务
摘要
测试数据生成
测试数据生成
RAG
RAG
RAG测试集生成
知识图谱构建
场景生成
代理或工具使用
代理或工具使用
代理或工具用例的测试集生成
反馈智能
反馈智能
🛠️ 操作指南
🛠️ 操作指南
定制化
定制化
通用
通用
定制模型
运行配置
指标
指标
修改指标中的提示
添加自定义指标
测试集生成
测试集生成
添加自定义场景
使用生产数据进行种子生成
应用
应用
集成
集成
📖 参考资料
📖 参考资料
核心
核心
提示
大型语言模型
嵌入
运行配置
执行器
评估
评估
模式
指标
评估()
测试集生成
测试集生成
模式
图
转换
合成器
生成
集成
❤️ 社区
指标
概述
了解更多关于概述和设计原则
可用指标
了解可用指标及其内部工作原理
Back to top