PresidioAnonymizerBase#

class langchain_experimental.data_anonymizer.presidio.PresidioAnonymizerBase(analyzed_fields: List[str] | None = None, operators: Dict[str, OperatorConfig] | None = None, languages_config: Dict | None = None, add_default_faker_operators: bool = True, faker_seed: int | None = None)[source]#

使用Microsoft Presidio的基础匿名器。

Parameters:

analyzed_fields (Optional[List[str]]) – 要检测并匿名化的字段列表。默认为 Microsoft Presidio 支持的所有实体。
operators (可选[Dict[str, OperatorConfig]]) – 用于匿名化的操作符。操作符允许对检测到的PII进行自定义匿名化。了解更多： https://microsoft.github.io/presidio/tutorial/10_simple_anonymization/
languages_config (可选[字典]) – NLP引擎的配置。当未指定语言时，列表中的第一种语言将用作self.anonymize(…)中的主要语言。了解更多： https://microsoft.github.io/presidio/analyzer/customizing_nlp_models/
faker_seed (可选[整数]) – 用于初始化faker的种子。默认为None，在这种情况下，faker将随机播种并提供随机值。
add_default_faker_operators (bool)

方法

`__init__`([analyzed_fields, operators, ...])
`add_operators`(operators)	向匿名化器添加操作符
`add_recognizer`(recognizer)	向分析器添加一个识别器
`anonymize`(text[, language, allow_list])	匿名化文本。

__init__(analyzed_fields: List[str] | None = None, operators: Dict[str, OperatorConfig] | None = None, languages_config: Dict | None = None, add_default_faker_operators: bool = True, faker_seed: int | None = None)[source]#

Parameters:

analyzed_fields (Optional[List[str]]) – 要检测并匿名化的字段列表。默认为 Microsoft Presidio 支持的所有实体。
operators (可选[Dict[str, OperatorConfig]]) – 用于匿名化的操作符。操作符允许对检测到的PII进行自定义匿名化。了解更多： https://microsoft.github.io/presidio/tutorial/10_simple_anonymization/
languages_config (可选[字典]) – NLP引擎的配置。当未指定语言时，列表中的第一种语言将用作self.anonymize(…)中的主要语言。了解更多： https://microsoft.github.io/presidio/analyzer/customizing_nlp_models/
faker_seed (可选[整数]) – 用于初始化faker的种子。默认为None，在这种情况下，faker将随机播种并提供随机值。
add_default_faker_operators (bool)

add_operators(operators: Dict[str, OperatorConfig]) → None[source]#

向匿名化器添加操作符

Parameters:: operators (Dict[str, OperatorConfig]) – 要添加到匿名化器的操作符。
Return type:: 无

add_recognizer(recognizer: EntityRecognizer) → None[来源]#

向分析器添加一个识别器

Parameters:: recognizer (EntityRecognizer) – 要添加到分析器的识别器。
Return type:: 无

anonymize(text: str, language: str | None = None, allow_list: List[str] | None = None) → str#

匿名化文本。

Parameters:

文本 (str)
语言 (str | 无)
allow_list (列表[字符串] | 无)

Return type:

字符串