langchain.evaluation.parsing.base.JsonEqualityEvaluator

class langchain.evaluation.parsing.base.JsonEqualityEvaluator(operator: Optional[Callable] = None, **kwargs: Any)[source]

评估是否在将预测和参考解析为JSON之后相等。

此评估器检查预测是否在解析为JSON后等于参考, 参考也被解析为JSON。它不需要输入字符串。

属性:

requires_input (bool): 此评估器是否需要输入字符串。始终为False。 requires_reference (bool): 此评估器是否需要参考字符串。始终为True。 evaluation_name (str): 评估指标的名称。始终为”parsed_equality”。

示例:
>>> evaluator = JsonEqualityEvaluator()
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 1}')
{'score': True}
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 2}')
{'score': False}
>>> evaluator = JsonEqualityEvaluator(operator=lambda x, y: x['a'] == y['a'])
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 1}')
{'score': True}
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 2}')
{'score': False}

Attributes

evaluation_name

评估的名称。

requires_input

评估器是否需要输入字符串。

requires_reference

评估器是否需要参考标签。

Methods

__init__([operator])

aevaluate_strings(*, prediction[, ...])

异步评估Chain或LLM输出,基于可选的输入和标签。

evaluate_strings(*, prediction[, reference, ...])

评估链式或LLM输出,基于可选输入和标签。

Parameters
  • operator (Optional[Callable]) –

  • kwargs (Any) –

Return type

None

__init__(operator: Optional[Callable] = None, **kwargs: Any) None[source]
Parameters
  • operator (Optional[Callable]) –

  • kwargs (Any) –

Return type

None

async aevaluate_strings(*, prediction: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict

异步评估Chain或LLM输出,基于可选的输入和标签。

参数:

prediction (str): 要评估的LLM或chain预测。 reference (Optional[str], optional): 要评估的参考标签。 input (Optional[str], optional): 评估过程中要考虑的输入。 **kwargs: 其他关键字参数,包括回调函数、标签等。

返回:

dict: 包含得分或值的评估结果。

Parameters
  • prediction (str) –

  • reference (Optional[str]) –

  • input (Optional[str]) –

  • kwargs (Any) –

Return type

dict

evaluate_strings(*, prediction: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict

评估链式或LLM输出,基于可选输入和标签。

参数:

prediction (str): 要评估的LLM或链预测。 reference (Optional[str], optional): 要评估的参考标签。 input (Optional[str], optional): 在评估过程中要考虑的输入。 **kwargs: 其他关键字参数,包括回调函数、标签等。

返回:

dict: 包含得分或值的评估结果。

Parameters
  • prediction (str) –

  • reference (Optional[str]) –

  • input (Optional[str]) –

  • kwargs (Any) –

Return type

dict

Examples using JsonEqualityEvaluator