langchain_experimental.data_anonymizer.deanonymizer_mapping.create_anonymizer_mapping

langchain_experimental.data_anonymizer.deanonymizer_mapping.create_anonymizer_mapping(original_text: str, analyzer_results: List[RecognizerResult], anonymizer_results: EngineResult, is_reversed: bool = False) Dict[str, Dict[str, str]][source]

创建或更新用于匿名化和/或去匿名化文本的映射。

该方法利用分析和匿名化过程返回的结果。

如果 is_reversed 为 True,则构建从每个原始实体到其匿名化值的映射。

如果 is_reversed 为 False,则构建从每个匿名化实体到其原始文本值的映射。

如果存在多个相同类型的实体,则映射将包括计数以区分它们。例如,如果输入文本中有两个名称,则映射将包括 NAME_1 和 NAME_2。

映射示例: {

“PERSON”: {

“<original>”: “<anonymized>”, “John Doe”: “Slim Shady”

}, “PHONE_NUMBER”: {

“111-111-1111”: “555-555-5555”

}

Parameters
  • original_text (str) –

  • analyzer_results (List[RecognizerResult]) –

  • anonymizer_results (EngineResult) –

  • is_reversed (bool) –

Return type

Dict[str, Dict[str, str]]