langchain.evaluation.schema
.PairwiseStringEvaluator¶
- class langchain.evaluation.schema.PairwiseStringEvaluator[source]¶
比较两个模型的输出(或同一模型的两个输出)。
Attributes
requires_input
评估器是否需要输入字符串。
requires_reference
评估器是否需要参考标签。
Methods
__init__
()aevaluate_string_pairs
(*, prediction, ...[, ...])异步评估输出字符串对。
evaluate_string_pairs
(*, prediction, ...[, ...])评估输出字符串对。
- __init__()¶
- async aevaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict [source]¶
异步评估输出字符串对。
- 参数:
prediction (str): 第一个模型的输出字符串。 prediction_b (str): 第二个模型的输出字符串。 reference (Optional[str], optional): 期望的输出/参考字符串。 input (Optional[str], optional): 输入字符串。 **kwargs: 其他关键字参数,如回调和可选的参考字符串。
- 返回:
dict: 包含偏好、分数和/或其他信息的字典。
- Parameters
prediction (str) –
prediction_b (str) –
reference (Optional[str]) –
input (Optional[str]) –
kwargs (Any) –
- Return type
dict
- evaluate_string_pairs(*, prediction: str, prediction_b: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict [source]¶
评估输出字符串对。
- 参数:
prediction (str): 第一个模型的输出字符串。 prediction_b (str): 第二个模型的输出字符串。 reference (Optional[str], optional): 期望的输出/参考字符串。 input (Optional[str], optional): 输入字符串。 **kwargs: 其他关键字参数,如回调和可选的参考字符串。
- 返回:
dict: 包含偏好、分数和/或其他信息的字典。
- Parameters
prediction (str) –
prediction_b (str) –
reference (Optional[str]) –
input (Optional[str]) –
kwargs (Any) –
- Return type
dict