pandas.Series.drop_duplicates#
- Series.drop_duplicates(*, keep='first', inplace=False, ignore_index=False)[源代码][源代码]#
返回删除了重复值的系列。
- 参数:
- keep : {‘first’, ‘last’,
False
}, 默认 ‘first’{‘first’, ‘last’,} 处理重复项的方法:
‘first’ : 删除重复项,除了第一次出现。
‘last’ : 删除重复项,除了最后一次出现。
False
: 删除所有重复项。
- inplace : bool, 默认
False
布尔值, 默认 如果
True
,则就地执行操作并返回 None。- ignore_index : bool, 默认为
False
布尔值, 默认 如果
True
,生成的轴将被标记为 0, 1, …, n - 1。Added in version 2.0.0.
- keep : {‘first’, ‘last’,
- 返回:
- 系列或无
如果
inplace=True
,则删除重复项的系列或为 None。
参见
Index.drop_duplicates
Index上的等效方法。
DataFrame.drop_duplicates
DataFrame 上的等效方法。
Series.duplicated
Series 上的相关方法,指示重复的 Series 值。
Series.unique
返回唯一值作为数组。
例子
生成一个包含重复条目的序列。
>>> s = pd.Series( ... ["llama", "cow", "llama", "beetle", "llama", "hippo"], name="animal" ... ) >>> s 0 llama 1 cow 2 llama 3 beetle 4 llama 5 hippo Name: animal, dtype: object
使用 ‘keep’ 参数,可以更改重复值的选择行为。值 ‘first’ 保留每个重复条目集的第一次出现。keep 的默认值是 ‘first’。
>>> s.drop_duplicates() 0 llama 1 cow 3 beetle 5 hippo Name: animal, dtype: object
参数 ‘keep’ 的值 ‘last’ 保留每组重复条目的最后一次出现。
>>> s.drop_duplicates(keep="last") 1 cow 3 beetle 4 llama 5 hippo Name: animal, dtype: object
参数 ‘keep’ 的值
False
会丢弃所有重复的条目集合。>>> s.drop_duplicates(keep=False) 1 cow 3 beetle 5 hippo Name: animal, dtype: object