pandas.Series.duplicated#

Series.duplicated(keep='first')[源代码][源代码]#

指示重复的 Series 值。

重复的值在结果的 Series 中被标记为 True 值。可以标记所有重复项、除第一个外的所有重复项或除最后一个外的所有重复项。

参数:

保持{‘first’, ‘last’, False}, 默认 ‘first’

处理重复项的方法：

‘first’ : 将重复项标记为 True ，除了第一次出现。
‘last’ : 将重复项标记为 True ，除了最后一次出现。
False : 将所有重复项标记为 True。

返回:

Series[bool]: 系列指示每个值是否在前面的值中出现过。

参见

Index.duplicated: pandas.Index 上的等效方法。
DataFrame.duplicated: pandas.DataFrame 上的等效方法。
Series.drop_duplicates: 从 Series 中移除重复值。

示例

默认情况下，对于每一组重复的值，第一次出现的值设置为 False，所有其他值设置为 True：

>>> animals = pd.Series(["llama", "cow", "llama", "beetle", "llama"])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype: bool

这相当于

>>> animals.duplicated(keep="first")
  False
  False
   True
  False
   True
dtype: bool

通过使用 ‘last’，每组重复值的最后一次出现被设置为 False，其他所有出现被设置为 True：

>>> animals.duplicated(keep="last")
   True
  False
   True
  False
  False
dtype: bool

通过将 keep 设置为 False ，所有重复项均为 True：

>>> animals.duplicated(keep=False)
   True
  False
   True
  False
   True
dtype: bool