dask.dataframe.groupby.SeriesGroupBy.cumcount

dask.dataframe.groupby.SeriesGroupBy.cumcount

SeriesGroupBy.cumcount(axis=_NoDefault.no_default)

每个组中的每一项从0到该组长度减1进行编号。

此文档字符串是从 pandas.core.groupby.groupby.GroupBy.cumcount 复制的。

Dask 版本可能存在一些不一致性。

本质上这等同于

self.apply(lambda x: pd.Series(np.arange(len(x)), x.index))
参数
升序bool, 默认 True (Dask 不支持)

如果为 False,则从组长度 - 1 到 0 进行反向编号。

返回
系列

每个组内每个元素的序号。

参见

ngroup

对组本身进行编号。

示例

>>> df = pd.DataFrame([['a'], ['a'], ['a'], ['b'], ['b'], ['a']],  
...                   columns=['A'])
>>> df  
   A
0  a
1  a
2  a
3  b
4  b
5  a
>>> df.groupby('A').cumcount()  
0    0
1    1
2    2
3    0
4    1
5    3
dtype: int64
>>> df.groupby('A').cumcount(ascending=False)  
0    3
1    2
2    1
3    1
4    0
5    0
dtype: int64