pandas.Index.duplicated#
- Index.duplicated(keep='first')[源代码][源代码]#
指示重复的索引值。
重复的值在结果数组中表示为
True
值。可以指示所有重复项、除第一个外的所有重复项或除最后一个外的所有重复项。- 参数:
- 保持{‘first’, ‘last’, False}, 默认 ‘first’
要标记为缺失的一组重复值中的值或值。
‘first’ : 将重复项标记为
True
,除了第一次出现。‘last’ : 将重复项标记为
True
,除了最后一次出现。False
: 将所有重复项标记为True
。
- 返回:
- np.ndarray[bool]
一个布尔值的 numpy 数组,指示重复的索引值。
参见
Series.duplicated
pandas.Series 上的等效方法。
DataFrame.duplicated
pandas.DataFrame 上的等效方法。
Index.drop_duplicates
从索引中删除重复值。
例子
默认情况下,对于每一组重复的值,第一次出现的值设置为 False,所有其他的设置为 True:
>>> idx = pd.Index(["llama", "cow", "llama", "beetle", "llama"]) >>> idx.duplicated() array([False, False, True, False, True])
这相当于
>>> idx.duplicated(keep="first") array([False, False, True, False, True])
通过使用 ‘last’,每组重复值的最后一次出现被设置为 False,其他所有出现被设置为 True:
>>> idx.duplicated(keep="last") array([ True, False, True, False, False])
通过将
keep
设置为False
,所有重复项都是 True:>>> idx.duplicated(keep=False) array([ True, False, True, False, True])