dask.dataframe.groupby.DataFrameGroupBy.min

dask.dataframe.groupby.DataFrameGroupBy.min

DataFrameGroupBy.min(split_every=None, split_out=1, shuffle_method=None, numeric_only=_NoDefault.no_default)

计算组值的最小值。

此文档字符串是从 pandas.core.groupby.groupby.GroupBy.min 复制而来的。

Dask 版本可能存在一些不一致性。

参数
仅数值bool, 默认 False

仅包含浮点数、整数、布尔类型的列。

在 2.0.0 版更改: numeric_only 不再接受 None

min_countint, 默认 -1 (在 Dask 中不支持)

执行操作所需的有效值数量。如果非NA值的数量少于 min_count ,结果将为NA。

引擎str, 默认 None None (Dask 中不支持)
  • 'cython' : 通过来自 cython 的 C 扩展运行滚动应用。

  • 'numba'通过来自 numba 的 JIT 编译代码运行滚动应用。

    仅在 raw 设置为 True 时可用。

  • None : 默认为 'cython' 或全局设置 compute.use_numba

engine_kwargsdict, 默认 None None (Dask 中不支持)
  • 对于 'cython' 引擎,没有接受的 engine_kwargs

  • 对于 'numba' 引擎,该引擎可以接受 nopythonnogil

    parallel 字典键。值必须是 TrueFalse'numba' 引擎的默认 engine_kwargs{'nopython': True, 'nogil': False, 'parallel': False},并将应用于 funcapply groupby 聚合。

返回
Series 或 DataFrame

计算每个组内值的最小值。

示例

对于 SeriesGroupBy:

>>> lst = ['a', 'a', 'b', 'b']  
>>> ser = pd.Series([1, 2, 3, 4], index=lst)  
>>> ser  
a    1
a    2
b    3
b    4
dtype: int64
>>> ser.groupby(level=0).min()  
a    1
b    3
dtype: int64

对于 DataFrameGroupBy:

>>> data = [[1, 8, 2], [1, 2, 5], [2, 5, 8], [2, 6, 9]]  
>>> df = pd.DataFrame(data, columns=["a", "b", "c"],  
...                   index=["tiger", "leopard", "cheetah", "lion"])
>>> df  
          a  b  c
  tiger   1  8  2
leopard   1  2  5
cheetah   2  5  8
   lion   2  6  9
>>> df.groupby("a").min()  
    b  c
a
1   2  2
2   5  8