pandas.Series.drop_duplicates#

Series.drop_duplicates(*, keep='first', inplace=False, ignore_index=False)[源代码][源代码]#

返回删除了重复值的系列。

参数:
keep : {‘first’, ‘last’, False}, 默认 ‘first’{‘first’, ‘last’,}

处理重复项的方法:

  • ‘first’ : 删除重复项,除了第一次出现。

  • ‘last’ : 删除重复项,除了最后一次出现。

  • False : 删除所有重复项。

inplace : bool, 默认 False布尔值, 默认

如果 True,则就地执行操作并返回 None。

ignore_index : bool, 默认为 False布尔值, 默认

如果 True,生成的轴将被标记为 0, 1, …, n - 1。

Added in version 2.0.0.

返回:
系列或无

如果 inplace=True,则删除重复项的系列或为 None。

参见

Index.drop_duplicates

Index上的等效方法。

DataFrame.drop_duplicates

DataFrame 上的等效方法。

Series.duplicated

Series 上的相关方法,指示重复的 Series 值。

Series.unique

返回唯一值作为数组。

例子

生成一个包含重复条目的序列。

>>> s = pd.Series(
...     ["llama", "cow", "llama", "beetle", "llama", "hippo"], name="animal"
... )
>>> s
0     llama
1       cow
2     llama
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

使用 ‘keep’ 参数,可以更改重复值的选择行为。值 ‘first’ 保留每个重复条目集的第一次出现。keep 的默认值是 ‘first’。

>>> s.drop_duplicates()
0     llama
1       cow
3    beetle
5     hippo
Name: animal, dtype: object

参数 ‘keep’ 的值 ‘last’ 保留每组重复条目的最后一次出现。

>>> s.drop_duplicates(keep="last")
1       cow
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

参数 ‘keep’ 的值 False 会丢弃所有重复的条目集合。

>>> s.drop_duplicates(keep=False)
1       cow
3    beetle
5     hippo
Name: animal, dtype: object