pandas.Index.duplicated#

Index.duplicated(keep='first')[源代码][源代码]#

指示重复的索引值。

重复的值在结果数组中表示为 True 值。可以指示所有重复项、除第一个外的所有重复项或除最后一个外的所有重复项。

参数:

保持{‘first’, ‘last’, False}, 默认 ‘first’

要标记为缺失的一组重复值中的值或值。

返回:

参见

例子

默认情况下，对于每一组重复的值，第一次出现的值设置为 False，所有其他的设置为 True：

>>> idx = pd.Index(["llama", "cow", "llama", "beetle", "llama"])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这相当于

>>> idx.duplicated(keep="first")
array([False, False,  True, False,  True])

通过使用 ‘last’，每组重复值的最后一次出现被设置为 False，其他所有出现被设置为 True：

>>> idx.duplicated(keep="last")
array([ True, False,  True, False, False])

通过将 keep 设置为 False ，所有重复项都是 True：

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])