`langchain.evaluation.parsing.base`.JsonEqualityEvaluator¶

class langchain.evaluation.parsing.base.JsonEqualityEvaluator(operator: Optional[Callable] = None, **kwargs: Any)[source]¶

评估是否在将预测和参考解析为JSON之后相等。

此评估器检查预测是否在解析为JSON后等于参考，参考也被解析为JSON。它不需要输入字符串。

属性:

requires_input (bool): 此评估器是否需要输入字符串。始终为False。 requires_reference (bool): 此评估器是否需要参考字符串。始终为True。 evaluation_name (str): 评估指标的名称。始终为”parsed_equality”。

示例:

>>> evaluator = JsonEqualityEvaluator()
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 1}')
{'score': True}
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 2}')
{'score': False}

>>> evaluator = JsonEqualityEvaluator(operator=lambda x, y: x['a'] == y['a'])
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 1}')
{'score': True}
>>> evaluator.evaluate_strings('{"a": 1}', reference='{"a": 2}')
{'score': False}

Attributes

`evaluation_name`	评估的名称。
`requires_input`	评估器是否需要输入字符串。
`requires_reference`	评估器是否需要参考标签。

Methods

`__init__`([operator])
`aevaluate_strings`(*, prediction[, ...])	异步评估Chain或LLM输出，基于可选的输入和标签。
`evaluate_strings`(*, prediction[, reference, ...])	评估链式或LLM输出，基于可选输入和标签。

Parameters

operator (Optional[Callable]) –
kwargs (Any) –

Return type

None

__init__(operator: Optional[Callable] = None, **kwargs: Any) → None[source]¶

Parameters

operator (Optional[Callable]) –
kwargs (Any) –

Return type

None

async aevaluate_strings(*, prediction: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) → dict¶

异步评估Chain或LLM输出，基于可选的输入和标签。

参数:: prediction (str): 要评估的LLM或chain预测。 reference (Optional[str], optional): 要评估的参考标签。 input (Optional[str], optional): 评估过程中要考虑的输入。 **kwargs: 其他关键字参数，包括回调函数、标签等。
返回:: dict: 包含得分或值的评估结果。

Parameters

prediction (str) –
reference (Optional[str]) –
input (Optional[str]) –
kwargs (Any) –

Return type

dict

evaluate_strings(*, prediction: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) → dict¶

评估链式或LLM输出，基于可选输入和标签。

参数:: prediction (str): 要评估的LLM或链预测。 reference (Optional[str], optional): 要评估的参考标签。 input (Optional[str], optional): 在评估过程中要考虑的输入。 **kwargs: 其他关键字参数，包括回调函数、标签等。
返回:: dict: 包含得分或值的评估结果。

Parameters

prediction (str) –
reference (Optional[str]) –
input (Optional[str]) –
kwargs (Any) –

Return type

dict

Examples using JsonEqualityEvaluator¶

Equivalently

langchain.evaluation.parsing.base.JsonEqualityEvaluator¶

Examples using JsonEqualityEvaluator¶

`langchain.evaluation.parsing.base`.JsonEqualityEvaluator¶