pandas.Series.duplicated#

Series.duplicated(keep='first')[源代码][源代码]#

指示重复的 Series 值。

重复的值在结果的 Series 中被标记为 True 值。可以标记所有重复项、除第一个外的所有重复项或除最后一个外的所有重复项。

参数:
保持{‘first’, ‘last’, False}, 默认 ‘first’

处理重复项的方法:

  • ‘first’ : 将重复项标记为 True ,除了第一次出现。

  • ‘last’ : 将重复项标记为 True ,除了最后一次出现。

  • False : 将所有重复项标记为 True

返回:
Series[bool]

系列指示每个值是否在前面的值中出现过。

参见

Index.duplicated

pandas.Index 上的等效方法。

DataFrame.duplicated

pandas.DataFrame 上的等效方法。

Series.drop_duplicates

从 Series 中移除重复值。

示例

默认情况下,对于每一组重复的值,第一次出现的值设置为 False,所有其他值设置为 True:

>>> animals = pd.Series(["llama", "cow", "llama", "beetle", "llama"])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype: bool

这相当于

>>> animals.duplicated(keep="first")
0    False
1    False
2     True
3    False
4     True
dtype: bool

通过使用 ‘last’,每组重复值的最后一次出现被设置为 False,其他所有出现被设置为 True:

>>> animals.duplicated(keep="last")
0     True
1    False
2     True
3    False
4    False
dtype: bool

通过将 keep 设置为 False ,所有重复项均为 True:

>>> animals.duplicated(keep=False)
0     True
1    False
2     True
3    False
4     True
dtype: bool