Toggle Menu

`langchain.evaluation.schema`.EvaluatorType¶

class langchain.evaluation.schema.EvaluatorType(value, names=None, *, module=None, qualname=None, type=None, start=1, boundary=None)[source]¶

评估者的类型。

QA = 'qa'¶: 问题回答评估器，直接使用LLM对问题的答案进行评分。

COT_QA = 'cot_qa'¶: 链式思维问答评估器，用于评分问题的答案，使用链式思维“推理”。

CONTEXT_QA = 'context_qa'¶: 在回答中包含“上下文”的问答评估器。

PAIRWISE_STRING = 'pairwise_string'¶: 一对一字符串评估器，用于预测在两个模型之间的首选预测。

SCORE_STRING = 'score_string'¶: 评分字符串评估器，为预测结果给出1到10之间的分数。

LABELED_PAIRWISE_STRING = 'labeled_pairwise_string'¶: 标记的成对字符串评估器，根据地面真实参考标签，预测两个模型之间的首选预测。

LABELED_SCORE_STRING = 'labeled_score_string'¶: 标记的得分字符串评估器，根据基于真实标签的预测给出1到10的分数。

AGENT_TRAJECTORY = 'trajectory'¶: 代理轨迹评估器，用于评分代理的中间步骤。

CRITERIA = 'criteria'¶: 评估器，根据自定义一组标准评估模型，而不需要任何参考标签。

LABELED_CRITERIA = 'labeled_criteria'¶: 标记的标准评估器，根据一组自定义标准以及一个参考标签来评估模型。

STRING_DISTANCE = 'string_distance'¶: 使用字符串编辑距离比较预测结果和参考答案。

EXACT_MATCH = 'exact_match'¶: 使用精确匹配方法将预测结果与参考答案进行比较。

REGEX_MATCH = 'regex_match'¶: 使用正则表达式将预测结果与参考答案进行比较。

PAIRWISE_STRING_DISTANCE = 'pairwise_string_distance'¶: 基于字符串编辑距离的预测进行比较。

EMBEDDING_DISTANCE = 'embedding_distance'¶: 使用嵌入距离比较预测和参考标签。

PAIRWISE_EMBEDDING_DISTANCE = 'pairwise_embedding_distance'¶: 使用嵌入距离比较两个预测。

JSON_VALIDITY = 'json_validity'¶: 检查预测是否为有效的JSON。

JSON_EQUALITY = 'json_equality'¶: 检查预测是否等于参考JSON。

JSON_EDIT_DISTANCE = 'json_edit_distance'¶: 计算规范化后的两个JSON字符串之间的编辑距离。

JSON_SCHEMA_VALIDATION = 'json_schema_validation'¶: 检查预测是否符合JSON模式。

Examples using EvaluatorType¶