pandas.Index.duplicated#

Index.duplicated(keep='first')[源代码][源代码]#

指示重复的索引值。

重复的值在结果数组中表示为 True 值。可以指示所有重复项、除第一个外的所有重复项或除最后一个外的所有重复项。

参数:
保持{‘first’, ‘last’, False}, 默认 ‘first’

要标记为缺失的一组重复值中的值或值。

  • ‘first’ : 将重复项标记为 True ,除了第一次出现。

  • ‘last’ : 将重复项标记为 True ,除了最后一次出现。

  • False : 将所有重复项标记为 True

返回:
np.ndarray[bool]

一个布尔值的 numpy 数组,指示重复的索引值。

参见

Series.duplicated

pandas.Series 上的等效方法。

DataFrame.duplicated

pandas.DataFrame 上的等效方法。

Index.drop_duplicates

从索引中删除重复值。

例子

默认情况下,对于每一组重复的值,第一次出现的值设置为 False,所有其他的设置为 True:

>>> idx = pd.Index(["llama", "cow", "llama", "beetle", "llama"])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这相当于

>>> idx.duplicated(keep="first")
array([False, False,  True, False,  True])

通过使用 ‘last’,每组重复值的最后一次出现被设置为 False,其他所有出现被设置为 True:

>>> idx.duplicated(keep="last")
array([ True, False,  True, False, False])

通过将 keep 设置为 False ,所有重复项都是 True:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])