pandas.Series.duplicated#
- Series.duplicated(keep='first')[源代码][源代码]#
指示重复的 Series 值。
重复的值在结果的 Series 中被标记为
True
值。可以标记所有重复项、除第一个外的所有重复项或除最后一个外的所有重复项。- 参数:
- 保持{‘first’, ‘last’, False}, 默认 ‘first’
处理重复项的方法:
‘first’ : 将重复项标记为
True
,除了第一次出现。‘last’ : 将重复项标记为
True
,除了最后一次出现。False
: 将所有重复项标记为True
。
- 返回:
- Series[bool]
系列指示每个值是否在前面的值中出现过。
参见
Index.duplicated
pandas.Index 上的等效方法。
DataFrame.duplicated
pandas.DataFrame 上的等效方法。
Series.drop_duplicates
从 Series 中移除重复值。
示例
默认情况下,对于每一组重复的值,第一次出现的值设置为 False,所有其他值设置为 True:
>>> animals = pd.Series(["llama", "cow", "llama", "beetle", "llama"]) >>> animals.duplicated() 0 False 1 False 2 True 3 False 4 True dtype: bool
这相当于
>>> animals.duplicated(keep="first") 0 False 1 False 2 True 3 False 4 True dtype: bool
通过使用 ‘last’,每组重复值的最后一次出现被设置为 False,其他所有出现被设置为 True:
>>> animals.duplicated(keep="last") 0 True 1 False 2 True 3 False 4 False dtype: bool
通过将
keep
设置为False
,所有重复项均为 True:>>> animals.duplicated(keep=False) 0 True 1 False 2 True 3 False 4 True dtype: bool