pandas.Index.drop_duplicates#
- Index.drop_duplicates(*, keep='first')[源代码][源代码]#
返回删除了重复值的索引。
- 参数:
- keep : {‘first’, ‘last’,
False
}, 默认 ‘first’{‘first’, ‘last’,} ‘first’ : 删除重复项,除了第一次出现。
‘last’ : 删除重复项,除了最后一次出现。
False
: 删除所有重复项。
- keep : {‘first’, ‘last’,
- 返回:
- 索引
一个去除了重复值的新索引对象。
参见
Series.drop_duplicates
Series 上的等效方法。
DataFrame.drop_duplicates
DataFrame 上的等效方法。
Index.duplicated
Index 上的相关方法,指示重复的 Index 值。
例子
生成一个包含重复值的 pandas.Index。
>>> idx = pd.Index(["llama", "cow", "llama", "beetle", "llama", "hippo"])
keep 参数控制删除哪些重复值。值 ‘first’ 保留每个重复条目的首次出现。keep 的默认值是 ‘first’。
>>> idx.drop_duplicates(keep="first") Index(['llama', 'cow', 'beetle', 'hippo'], dtype='object')
值 ‘last’ 保留每组重复条目的最后一次出现。
>>> idx.drop_duplicates(keep="last") Index(['cow', 'beetle', 'llama', 'hippo'], dtype='object')
值
False
丢弃所有重复的条目集合。>>> idx.drop_duplicates(keep=False) Index(['cow', 'beetle', 'hippo'], dtype='object')