langchain_experimental.data_anonymizer.deanonymizer_matching_strategies
.combined_exact_fuzzy_matching_strategy¶
- langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.combined_exact_fuzzy_matching_strategy(text: str, deanonymizer_mapping: Dict[str, Dict[str, str]], max_l_dist: int = 3) str [source]¶
组合精确匹配和模糊匹配策略用于去匿名化。
这是一种推荐的策略。
- 参数:
text:需要去匿名化的文本 deanonymizer_mapping:匿名实体和原始实体之间的映射 max_l_dist:匿名实体和文本段之间的最大Levenshtein距离,以便将其视为匹配项
- 匹配的示例:
Kaenu Reves -> Keanu Reeves John F. Kennedy -> John Kennedy
- Parameters
text (str) –
deanonymizer_mapping (Dict[str, Dict[str, str]]) –
max_l_dist (int) –
- Return type
str