pandas.core.groupby.SeriesGroupBy.rank#
- SeriesGroupBy.rank(method='average', ascending=True, na_option='keep', pct=False)[源代码]#
提供每个组内值的排名。
- 参数:
- 方法{‘average’, ‘min’, ‘max’, ‘first’, ‘dense’}, 默认 ‘average’
average: 组的平均排名。
min: 组中最低等级。
max: 组中最高等级。
首先:按它们在数组中出现的顺序分配等级。
dense: 类似于 ‘min’,但组之间的等级总是增加1。
- 升序布尔值, 默认为 True
False 表示从高 (1) 到低 (N) 的排名。
- na_option{‘keep’, ‘top’, ‘bottom’}, 默认 ‘keep’
keep: 保留 NA 值在原位。
top: 如果升序,则最小的等级。
bottom: 如果降序,则是最小的等级。
- pctbool, 默认为 False
计算每个组内数据的百分比排名。
- 返回:
- DataFrame
每个组内值的排名。
参见
Series.groupby
对一个 Series 应用 groupby 函数。
DataFrame.groupby
对DataFrame的每一行或每一列应用一个groupby函数。
示例
>>> df = pd.DataFrame( ... { ... "group": ["a", "a", "a", "a", "a", "b", "b", "b", "b", "b"], ... "value": [2, 4, 2, 3, 5, 1, 2, 4, 1, 5], ... } ... ) >>> df group value 0 a 2 1 a 4 2 a 2 3 a 3 4 a 5 5 b 1 6 b 2 7 b 4 8 b 1 9 b 5 >>> for method in ["average", "min", "max", "dense", "first"]: ... df[f"{method}_rank"] = df.groupby("group")["value"].rank(method) >>> df group value average_rank min_rank max_rank dense_rank first_rank 0 a 2 1.5 1.0 2.0 1.0 1.0 1 a 4 4.0 4.0 4.0 3.0 4.0 2 a 2 1.5 1.0 2.0 1.0 2.0 3 a 3 3.0 3.0 3.0 2.0 3.0 4 a 5 5.0 5.0 5.0 4.0 5.0 5 b 1 1.5 1.0 2.0 1.0 1.0 6 b 2 3.0 3.0 3.0 2.0 3.0 7 b 4 4.0 4.0 4.0 3.0 4.0 8 b 1 1.5 1.0 2.0 1.0 2.0 9 b 5 5.0 5.0 5.0 4.0 5.0