langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.ngram_fuzzy_matching_strategy

langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.ngram_fuzzy_matching_strategy(text: str, deanonymizer_mapping: Dict[str, Dict[str, str]], fuzzy_threshold: int = 85, use_variable_length: bool = True) str[source]

N-gram模糊匹配策略用于去匿名化。

它将所有匿名实体替换为原始实体。 它使用模糊匹配来找到文本中匿名实体的位置。 它从文本中生成与匿名实体相同长度的n-gram,并使用模糊匹配来找到文本中匿名实体的位置。

参数:

text:需要去匿名化的文本 deanonymizer_mapping:匿名实体和原始实体之间的映射 fuzzy_threshold:模糊匹配阈值 use_variable_length:是否使用(n-1, n, n+1)-gram或只使用n-gram

Parameters
  • text (str) –

  • deanonymizer_mapping (Dict[str, Dict[str, str]]) –

  • fuzzy_threshold (int) –

  • use_variable_length (bool) –

Return type

str