模糊匹配策略#

langchain_experimental.data_anonymizer.deanonymizer_matching_strategies.fuzzy_matching_strategy(text: str, deanonymizer_mapping: Dict[str, Dict[str, str]], max_l_dist: int = 3) str[source]#

用于去匿名化的模糊匹配策略。

它使用模糊匹配来查找文本中匿名实体的位置。 它用原始实体替换所有匿名实体。

Parameters:
  • text (str) – 要反匿名的文本

  • deanonymizer_mapping (Dict[str, Dict[str, str]]) – 匿名化实体与原始实体之间的映射

  • max_l_dist (int) – 匿名化实体与文本段之间的最大Levenshtein距离,以考虑其为匹配项

Return type:

字符串

Examples of matching:

Kaenu Reves -> 基努·里维斯 John F. Kennedy -> 约翰·肯尼迪