Tonic validate
AnswerConsistencyBinaryEvaluator #
Bases: BaseEvaluator
Tonic Validate的答案一致性二元指标。
输出分数是一个浮点数,要么是0.0,要么是1.0。
更多详情请参见https://docs.tonic.ai/validate/。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
openai_service(OpenAIService) |
要使用的OpenAI服务。指定要用作LLM评估器的聊天完成模型。默认为"gpt-4"。 |
required |
Source code in llama_index/evaluation/tonic_validate/answer_consistency_binary.py
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
|
AnswerConsistencyEvaluator #
Bases: BaseEvaluator
Tonic Validate的答案一致性指标。
输出分数是一个介于0.0和1.0之间的浮点数。
更多详情请参见https://docs.tonic.ai/validate/。
Args: openai_service(OpenAIService):要使用的OpenAI服务。指定用作LLM评估器的聊天完成模型。默认为"gpt-4"。
Source code in llama_index/evaluation/tonic_validate/answer_consistency.py
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
|
AnswerSimilarityEvaluator #
Bases: BaseEvaluator
Tonic Validate的答案相似度度量。
输出分数是一个介于0.0和5.0之间的浮点数。
请参阅https://docs.tonic.ai/validate/了解更多详情。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
openai_service(OpenAIService) |
要使用的OpenAI服务。指定要用作LLM评估器的聊天完成模型。默认为"gpt-4"。 |
required |
Source code in llama_index/evaluation/tonic_validate/answer_similarity.py
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 |
|
AugmentationAccuracyEvaluator #
Bases: BaseEvaluator
Tonic Validate的增强准确度指标。
输出得分为0.0到1.0之间的浮点数。
更多详情请参阅https://docs.tonic.ai/validate/。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
openai_service(OpenAIService) |
要使用的OpenAI服务。指定用作LLM评估器的聊天完成模型。默认为"gpt-4"。 |
required |
Source code in llama_index/evaluation/tonic_validate/augmentation_accuracy.py
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
|
AugmentationPrecisionEvaluator #
Bases: BaseEvaluator
Tonic Validate的增强精度指标。
输出分数是一个介于0.0和1.0之间的浮点数。
请参阅https://docs.tonic.ai/validate/获取更多详细信息。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
openai_service(OpenAIService) |
要使用的OpenAI服务。指定用作LLM评估器的聊天完成模型。默认为"gpt-4"。 |
required |
Source code in llama_index/evaluation/tonic_validate/augmentation_precision.py
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
|
RetrievalPrecisionEvaluator #
Bases: BaseEvaluator
Tonic Validate的检索精度指标。
输出分数是一个介于0.0和1.0之间的浮点数。
更多详情请参阅https://docs.tonic.ai/validate/。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
openai_service(OpenAIService) |
要使用的OpenAI服务。指定用作LLM评估器的聊天完成模型。默认为"gpt-4"。 |
required |
Source code in llama_index/evaluation/tonic_validate/retrieval_precision.py
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
|
TonicValidateEvaluator #
Bases: BaseEvaluator
Tonic Validate的验证评分器。计算所有Tonic Validate的指标。
有关更多详细信息,请参见https://docs.tonic.ai/validate/。
Source code in llama_index/evaluation/tonic_validate/tonic_validate_evaluator.py
30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 |
|
aevaluate_run
async
#
aevaluate_run(
queries: List[str],
responses: List[str],
contexts_list: List[List[str]],
reference_responses: List[str],
**kwargs: Any
) -> Any
评估一批响应。
返回一个Tonic Validate Run对象,可以将其记录到Tonic Validate UI中。更多详情请参阅https://docs.tonic.ai/validate/。
Source code in llama_index/evaluation/tonic_validate/tonic_validate_evaluator.py
103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 |
|
evaluate_run #
evaluate_run(
queries: List[str],
responses: List[str],
contexts_list: List[List[str]],
reference_responses: List[str],
**kwargs: Any
) -> Any
评估一批响应。
返回一个Tonic Validate Run对象,可以将其记录到Tonic Validate UI中。更多详情请参阅https://docs.tonic.ai/validate/。
Source code in llama_index/evaluation/tonic_validate/tonic_validate_evaluator.py
135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 |
|