Retrieval
评估模块。
BaseRetrievalEvaluator #
Bases: BaseModel
基本的检索评估器类。
Source code in llama_index/core/evaluation/retrieval/base.py
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 |
|
from_metric_names
classmethod
#
from_metric_names(
metric_names: List[str], **kwargs: Any
) -> BaseRetrievalEvaluator
从指标名称创建评估器。
Source code in llama_index/core/evaluation/retrieval/base.py
86 87 88 89 90 91 92 93 94 95 96 97 |
|
evaluate #
evaluate(
query: str,
expected_ids: List[str],
expected_texts: Optional[List[str]] = None,
mode: RetrievalEvalMode = RetrievalEvalMode.TEXT,
**kwargs: Any
) -> RetrievalEvalResult
运行带有查询字符串和预期id的评估结果。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
query |
str
|
查询字符串 |
required |
expected_ids |
List[str]
|
预期的id列表 |
required |
Returns:
Name | Type | Description |
---|---|---|
RetrievalEvalResult |
RetrievalEvalResult
|
评估结果 |
Source code in llama_index/core/evaluation/retrieval/base.py
106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 |
|
aevaluate
async
#
aevaluate(
query: str,
expected_ids: List[str],
expected_texts: Optional[List[str]] = None,
mode: RetrievalEvalMode = RetrievalEvalMode.TEXT,
**kwargs: Any
) -> RetrievalEvalResult
使用查询字符串、检索到的上下文和生成的响应字符串运行评估。
子类可以重写此方法以提供自定义评估逻辑,并接受额外的参数。
Source code in llama_index/core/evaluation/retrieval/base.py
134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 |
|
aevaluate_dataset
async
#
aevaluate_dataset(
dataset: EmbeddingQAFinetuneDataset,
workers: int = 2,
show_progress: bool = False,
**kwargs: Any
) -> List[RetrievalEvalResult]
使用数据集进行评估。
Source code in llama_index/core/evaluation/retrieval/base.py
166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 |
|
RetrieverEvaluator #
Bases: BaseRetrievalEvaluator
检索器评估器。
该模块将使用一组指标评估检索器。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
metrics |
List[BaseRetrievalMetric]
|
用于评估的指标序列 |
required |
retriever |
BaseRetriever
|
要评估的检索器。 |
required |
node_postprocessors |
Optional[List[BaseNodePostprocessor]]
|
检索后应用的后处理器。 |
None
|
Source code in llama_index/core/evaluation/retrieval/evaluator.py
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 |
|
RetrievalEvalResult #
Bases: BaseModel
检索评估结果。
注意:这个抽象可能会在将来发生变化。
属性
query (str): 查询字符串 expected_ids (List[str]): 期望的id retrieved_ids (List[str]): 检索到的id metric_dict (Dict[str, BaseRetrievalMetric]): 评估的指标字典
Source code in llama_index/core/evaluation/retrieval/base.py
36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 |
|