Ragas

指标

explodinggradients/ragas

Ragas

explodinggradients/ragas

🚀 快速开始
🚀 快速开始
📚 核心概念
📚 核心概念
- 组件
  组件
  - 通用
    通用
    
    提示
  - 评估
    评估
    
    评估样本
    
    评估数据集
- 指标
  指标
  - 概述
  - 可用指标
    
    可用指标
    
    检索增强生成
    检索增强生成
    
    上下文精度
    
    上下文召回率
    
    上下文实体召回率
    
    噪声敏感性
    
    响应相关性
    
    真实度
    
    代理或工具使用案例
    代理或工具使用案例
    
    代理或工具使用
    
    主题遵从性
    
    工具调用准确性
    
    代理目标准确性
    
    自然语言比较
    自然语言比较
    
    事实正确性
    
    语义相似度
    
    传统非LLM指标
    传统非LLM指标
    
    传统NLP指标
    
    非LLM字符串相似度
    
    BLEU分数
    
    ROUGE分数
    
    字符串存在
    
    精确匹配
    
    SQL
    SQL
    
    SQL
    
    基于执行的Datacompy分数
    
    SQL查询等价性
    
    通用
    通用
    
    通用评估指标
    
    方面评论家
    
    简单标准评分
    
    基于评分标准评分
    
    实例特定评分标准评分
    
    其他任务
    其他任务
    
    摘要
- 测试数据生成
  测试数据生成
  - RAG
    RAG
    
    RAG测试集生成
    
    知识图谱构建
    
    场景生成
  - 代理或工具使用
    代理或工具使用
    
    代理或工具用例的测试集生成
- 反馈智能
  反馈智能
🛠️ 操作指南
🛠️ 操作指南
- 定制化
  定制化
  - 通用
    通用
    
    定制模型
    
    运行配置
  - 指标
    指标
    
    修改指标中的提示
    
    添加自定义指标
  - 测试集生成
    测试集生成
    
    添加自定义场景
    
    使用生产数据进行种子生成
- 应用
  应用
- 集成
  集成
📖 参考资料
📖 参考资料
- 核心
  核心
- 评估
  评估
  - 模式
  - 指标
  - 评估()
- 测试集生成
  测试集生成
  - 模式
  - 图
  - 转换
  - 合成器
  - 生成
- 集成
❤️ 社区