dask.dataframe.groupby.DataFrameGroupBy.min

dask.dataframe.groupby.DataFrameGroupBy.min¶

DataFrameGroupBy.min(split_every=None, split_out=1, shuffle_method=None, numeric_only=_NoDefault.no_default)¶

计算组值的最小值。

此文档字符串是从 pandas.core.groupby.groupby.GroupBy.min 复制而来的。

Dask 版本可能存在一些不一致性。

参数

仅数值bool, 默认 False

仅包含浮点数、整数、布尔类型的列。

在 2.0.0 版更改: numeric_only 不再接受 None。

min_countint, 默认 -1 (在 Dask 中不支持)

执行操作所需的有效值数量。如果非NA值的数量少于 min_count ，结果将为NA。

引擎str, 默认 None None （Dask 中不支持）

'cython' : 通过来自 cython 的 C 扩展运行滚动应用。
'numba'通过来自 numba 的 JIT 编译代码运行滚动应用。
仅在 raw 设置为 True 时可用。
None : 默认为 'cython' 或全局设置 compute.use_numba

engine_kwargsdict, 默认 None None （Dask 中不支持）

对于 'cython' 引擎，没有接受的 engine_kwargs
对于 'numba' 引擎，该引擎可以接受 nopython、nogil
和 parallel 字典键。值必须是 True 或 False。'numba' 引擎的默认 engine_kwargs 是 {'nopython': True, 'nogil': False, 'parallel': False}，并将应用于 func 和 apply groupby 聚合。

返回

Series 或 DataFrame: 计算每个组内值的最小值。

示例

对于 SeriesGroupBy:

>>> lst = ['a', 'a', 'b', 'b']  
>>> ser = pd.Series([1, 2, 3, 4], index=lst)  
>>> ser  
a    1
a    2
b    3
b    4
dtype: int64
>>> ser.groupby(level=0).min()  
a    1
b    3
dtype: int64

对于 DataFrameGroupBy：

>>> data = [[1, 8, 2], [1, 2, 5], [2, 5, 8], [2, 6, 9]]  
>>> df = pd.DataFrame(data, columns=["a", "b", "c"],  
...                   index=["tiger", "leopard", "cheetah", "lion"])
>>> df  
          a  b  c
  tiger   1  8  2
leopard   1  2  5
cheetah   2  5  8
   lion   2  6  9
>>> df.groupby("a").min()  
    b  c
a
1   2  2
2   5  8

dask.dataframe.groupby.DataFrameGroupBy.mean

dask.dataframe.groupby.DataFrameGroupBy.size