ngram_fuzzy_matching_strategy#
- langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.ngram_fuzzy_matching_strategy(text: str, deanonymizer_mapping: Dict[str, Dict[str, str]], fuzzy_threshold: int = 85, use_variable_length: bool = True) str [source]#
用于去匿名化的N-gram模糊匹配策略。
它将所有匿名实体替换为原始实体。 它使用模糊匹配来找到文本中匿名实体的位置。 它从文本中生成与匿名实体长度相同的n-grams,并使用模糊匹配来找到文本中匿名实体的位置。
- Parameters:
text (str) – 要反匿名的文本
deanonymizer_mapping (Dict[str, Dict[str, str]]) – 匿名化实体与原始实体之间的映射
fuzzy_threshold (int) – 模糊匹配阈值
use_variable_length (bool) – 是否使用 (n-1, n, n+1)-grams 或仅使用 n-grams
- Return type:
字符串