pandas.Series.drop_duplicates#

Series.drop_duplicates(*, keep='first', inplace=False, ignore_index=False)[源代码][源代码]#

返回删除了重复值的系列。

参数:

keep : {‘first’, ‘last’, False}, 默认 ‘first’{‘first’, ‘last’,}

处理重复项的方法：

‘first’ : 删除重复项，除了第一次出现。
‘last’ : 删除重复项，除了最后一次出现。
False : 删除所有重复项。

inplace : bool, 默认 False布尔值, 默认

如果 True，则就地执行操作并返回 None。

ignore_index : bool, 默认为 False布尔值, 默认

如果 True，生成的轴将被标记为 0, 1, …, n - 1。

Added in version 2.0.0.

返回:

系列或无: 如果 inplace=True，则删除重复项的系列或为 None。

参见

Index.drop_duplicates: Index上的等效方法。
DataFrame.drop_duplicates: DataFrame 上的等效方法。
Series.duplicated: Series 上的相关方法，指示重复的 Series 值。
Series.unique: 返回唯一值作为数组。

例子

生成一个包含重复条目的序列。

>>> s = pd.Series(
...     ["llama", "cow", "llama", "beetle", "llama", "hippo"], name="animal"
... )
>>> s
0     llama
1       cow
2     llama
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

使用 ‘keep’ 参数，可以更改重复值的选择行为。值 ‘first’ 保留每个重复条目集的第一次出现。keep 的默认值是 ‘first’。

>>> s.drop_duplicates()
0     llama
1       cow
3    beetle
5     hippo
Name: animal, dtype: object

参数 ‘keep’ 的值 ‘last’ 保留每组重复条目的最后一次出现。

>>> s.drop_duplicates(keep="last")
1       cow
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

参数 ‘keep’ 的值 False 会丢弃所有重复的条目集合。

>>> s.drop_duplicates(keep=False)
1       cow
3    beetle
5     hippo
Name: animal, dtype: object