dask.dataframe.groupby.SeriesGroupBy.mean
dask.dataframe.groupby.SeriesGroupBy.mean¶
- SeriesGroupBy.mean(split_every=None, split_out=1, shuffle_method=None, numeric_only=_NoDefault.no_default)¶
计算各组的均值,排除缺失值。
此文档字符串是从 pandas.core.groupby.groupby.GroupBy.mean 复制的。
Dask 版本可能存在一些不一致性。
- 参数
- 仅数值bool, 默认 False
仅包含浮点数、整数、布尔类型的列。
在 2.0.0 版更改: numeric_only 不再接受
None
并且默认值为False
。- 引擎str, 默认 None (Dask 中不支持)
'cython'
: 通过cython的C扩展运行操作。'numba'
: 通过来自 numba 的 JIT 编译代码运行操作。None
: 默认为'cython'
或全局设置compute.use_numba
1.4.0 新版功能.
- engine_kwargsdict, 默认 None (Dask 中不支持)
对于
'cython'
引擎,没有接受的engine_kwargs
对于
'numba'
引擎,该引擎可以接受nopython
、nogil
和parallel
字典键。这些键的值必须是True
或False
。'numba'
引擎的默认engine_kwargs
是{{'nopython': True, 'nogil': False, 'parallel': False}}
。
1.4.0 新版功能.
- 返回
- pandas.Series 或 pandas.DataFrame
参见
Series.groupby
对一个 Series 应用 groupby 函数。
DataFrame.groupby
对DataFrame的每一行或每一列应用一个groupby函数。
示例
>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2], ... 'B': [np.nan, 2, 3, 4, 5], ... 'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])
按一列分组,并返回每个组中其余列的平均值。
>>> df.groupby('A').mean() B C A 1 3.0 1.333333 2 4.0 1.500000
按两列分组并返回剩余列的平均值。
>>> df.groupby(['A', 'B']).mean() C A B 1 2.0 2.0 4.0 1.0 2 3.0 1.0 5.0 2.0
按一列分组并返回组内特定列的平均值。
>>> df.groupby('A')['B'].mean() A 1 3.0 2 4.0 Name: B, dtype: float64