langchain_experimental.data_anonymizer.deanonymizer_matching_strategies
.ngram_fuzzy_matching_strategy¶
- langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.ngram_fuzzy_matching_strategy(text: str, deanonymizer_mapping: Dict[str, Dict[str, str]], fuzzy_threshold: int = 85, use_variable_length: bool = True) str [source]¶
N-gram模糊匹配策略用于去匿名化。
它将所有匿名实体替换为原始实体。 它使用模糊匹配来找到文本中匿名实体的位置。 它从文本中生成与匿名实体相同长度的n-gram,并使用模糊匹配来找到文本中匿名实体的位置。
- 参数:
text:需要去匿名化的文本 deanonymizer_mapping:匿名实体和原始实体之间的映射 fuzzy_threshold:模糊匹配阈值 use_variable_length:是否使用(n-1, n, n+1)-gram或只使用n-gram
- Parameters
text (str) –
deanonymizer_mapping (Dict[str, Dict[str, str]]) –
fuzzy_threshold (int) –
use_variable_length (bool) –
- Return type
str