Correctness
评估模块。
CorrectnessEvaluator #
Bases: BaseEvaluator
正确性评估器。
评估问答系统的正确性。 该评估器依赖于提供“参考”答案,以及查询字符串和响应字符串。
它输出一个介于1和5之间的分数,其中1最差,5最佳,以及得分的理由。 通过被定义为得分大于或等于给定的阈值。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
service_context |
Optional[ServiceContext]
|
服务上下文。 |
None
|
eval_template |
Optional[Union[BasePromptTemplate, str]]
|
评估提示的模板。 |
None
|
score_threshold |
float
|
通过评估的数值阈值,默认为4.0。 |
4.0
|
Source code in llama_index/core/evaluation/correctness.py
69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 |
|