dask.dataframe.Series.str.normalize

dask.dataframe.Series.str.normalize

dataframe.Series.str.normalize(form)

返回 Series/Index 中字符串的 Unicode 规范化形式。

此文档字符串是从 pandas.core.strings.accessor.StringMethods.normalize 复制而来的。

Dask 版本可能存在一些不一致性。

有关表单的更多信息,请参阅 unicodedata.normalize()

参数
表单{‘NFC’, ‘NFKC’, ‘NFD’, ‘NFKD’}

Unicode 形式。

返回
对象的系列/索引

示例

>>> ser = pd.Series(['ñ'])  
>>> ser.str.normalize('NFC') == ser.str.normalize('NFD')  
0   False
dtype: bool