langchain.evaluation.exact_match.base
.ExactMatchStringEvaluator¶
- class langchain.evaluation.exact_match.base.ExactMatchStringEvaluator(*, ignore_case: bool = False, ignore_punctuation: bool = False, ignore_numbers: bool = False, **kwargs: Any)[source]¶
计算预测和参考之间的精确匹配。
>>> evaluator = ExactMatchChain() >>> evaluator.evaluate_strings( prediction="Mindy is the CTO", reference="Mindy is the CTO", ) # 这将返回 {'score': 1.0}
>>> evaluator.evaluate_strings( prediction="Mindy is the CTO", reference="Mindy is the CEO", ) # 这将返回 {'score': 0.0}
Attributes
evaluation_name
获取评估名称。
input_keys
获取输入键。
requires_input
这个评估器不需要输入。
requires_reference
这个评估器需要一个参考。
Methods
__init__
(*[, ignore_case, ...])aevaluate_strings
(*, prediction[, ...])异步评估Chain或LLM输出,基于可选的输入和标签。
evaluate_strings
(*, prediction[, reference, ...])评估链式或LLM输出,基于可选输入和标签。
- Parameters
ignore_case (bool) –
ignore_punctuation (bool) –
ignore_numbers (bool) –
kwargs (Any) –
- __init__(*, ignore_case: bool = False, ignore_punctuation: bool = False, ignore_numbers: bool = False, **kwargs: Any)[source]¶
- Parameters
ignore_case (bool) –
ignore_punctuation (bool) –
ignore_numbers (bool) –
kwargs (Any) –
- async aevaluate_strings(*, prediction: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict ¶
异步评估Chain或LLM输出,基于可选的输入和标签。
- 参数:
prediction (str): 要评估的LLM或chain预测。 reference (Optional[str], optional): 要评估的参考标签。 input (Optional[str], optional): 评估过程中要考虑的输入。 **kwargs: 其他关键字参数,包括回调函数、标签等。
- 返回:
dict: 包含得分或值的评估结果。
- Parameters
prediction (str) –
reference (Optional[str]) –
input (Optional[str]) –
kwargs (Any) –
- Return type
dict
- evaluate_strings(*, prediction: str, reference: Optional[str] = None, input: Optional[str] = None, **kwargs: Any) dict ¶
评估链式或LLM输出,基于可选输入和标签。
- 参数:
prediction (str): 要评估的LLM或链预测。 reference (Optional[str], optional): 要评估的参考标签。 input (Optional[str], optional): 在评估过程中要考虑的输入。 **kwargs: 其他关键字参数,包括回调函数、标签等。
- 返回:
dict: 包含得分或值的评估结果。
- Parameters
prediction (str) –
reference (Optional[str]) –
input (Optional[str]) –
kwargs (Any) –
- Return type
dict