pandas.Index.drop_duplicates#

Index.drop_duplicates(*, keep='first')[源代码][源代码]#

返回删除了重复值的索引。

参数:
keep : {‘first’, ‘last’, False}, 默认 ‘first’{‘first’, ‘last’,}
  • ‘first’ : 删除重复项,除了第一次出现。

  • ‘last’ : 删除重复项,除了最后一次出现。

  • False : 删除所有重复项。

返回:
索引

一个去除了重复值的新索引对象。

参见

Series.drop_duplicates

Series 上的等效方法。

DataFrame.drop_duplicates

DataFrame 上的等效方法。

Index.duplicated

Index 上的相关方法,指示重复的 Index 值。

例子

生成一个包含重复值的 pandas.Index。

>>> idx = pd.Index(["llama", "cow", "llama", "beetle", "llama", "hippo"])

keep 参数控制删除哪些重复值。值 ‘first’ 保留每个重复条目的首次出现。keep 的默认值是 ‘first’。

>>> idx.drop_duplicates(keep="first")
Index(['llama', 'cow', 'beetle', 'hippo'], dtype='object')

值 ‘last’ 保留每组重复条目的最后一次出现。

>>> idx.drop_duplicates(keep="last")
Index(['cow', 'beetle', 'llama', 'hippo'], dtype='object')

False 丢弃所有重复的条目集合。

>>> idx.drop_duplicates(keep=False)
Index(['cow', 'beetle', 'hippo'], dtype='object')