dask.dataframe.groupby.DataFrameGroupBy.cumcount
dask.dataframe.groupby.DataFrameGroupBy.cumcount¶
- DataFrameGroupBy.cumcount(axis=_NoDefault.no_default)¶
每个组中的每一项从0到该组长度减1进行编号。
此文档字符串是从 pandas.core.groupby.groupby.GroupBy.cumcount 复制的。
Dask 版本可能存在一些不一致性。
本质上这等同于
self.apply(lambda x: pd.Series(np.arange(len(x)), x.index))
- 参数
- 升序bool, 默认 True (Dask 不支持)
如果为 False,则从组长度 - 1 到 0 进行反向编号。
- 返回
- 系列
每个组内每个元素的序号。
参见
ngroup
对组本身进行编号。
示例
>>> df = pd.DataFrame([['a'], ['a'], ['a'], ['b'], ['b'], ['a']], ... columns=['A']) >>> df A 0 a 1 a 2 a 3 b 4 b 5 a >>> df.groupby('A').cumcount() 0 0 1 1 2 2 3 0 4 1 5 3 dtype: int64 >>> df.groupby('A').cumcount(ascending=False) 0 3 1 2 2 1 3 1 4 0 5 0 dtype: int64