dask.dataframe.groupby.SeriesGroupBy.mean

dask.dataframe.groupby.SeriesGroupBy.mean

SeriesGroupBy.mean(split_every=None, split_out=1, shuffle_method=None, numeric_only=_NoDefault.no_default)

计算各组的均值,排除缺失值。

此文档字符串是从 pandas.core.groupby.groupby.GroupBy.mean 复制的。

Dask 版本可能存在一些不一致性。

参数
仅数值bool, 默认 False

仅包含浮点数、整数、布尔类型的列。

在 2.0.0 版更改: numeric_only 不再接受 None 并且默认值为 False

引擎str, 默认 None (Dask 中不支持)
  • 'cython' : 通过cython的C扩展运行操作。

  • 'numba' : 通过来自 numba 的 JIT 编译代码运行操作。

  • None : 默认为 'cython' 或全局设置 compute.use_numba

1.4.0 新版功能.

engine_kwargsdict, 默认 None (Dask 中不支持)
  • 对于 'cython' 引擎,没有接受的 engine_kwargs

  • 对于 'numba' 引擎,该引擎可以接受 nopythonnogilparallel 字典键。这些键的值必须是 TrueFalse'numba' 引擎的默认 engine_kwargs{{'nopython': True, 'nogil': False, 'parallel': False}}

1.4.0 新版功能.

返回
pandas.Series 或 pandas.DataFrame

参见

Series.groupby

对一个 Series 应用 groupby 函数。

DataFrame.groupby

对DataFrame的每一行或每一列应用一个groupby函数。

示例

>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2],  
...                    'B': [np.nan, 2, 3, 4, 5],
...                    'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])

按一列分组,并返回每个组中其余列的平均值。

>>> df.groupby('A').mean()  
     B         C
A
1  3.0  1.333333
2  4.0  1.500000

按两列分组并返回剩余列的平均值。

>>> df.groupby(['A', 'B']).mean()  
         C
A B
1 2.0  2.0
  4.0  1.0
2 3.0  1.0
  5.0  2.0

按一列分组并返回组内特定列的平均值。

>>> df.groupby('A')['B'].mean()  
A
1    3.0
2    4.0
Name: B, dtype: float64