dask_expr._resample.Resampler.agg

dask_expr._resample.Resampler.agg

Resampler.agg(func, *args, **kwargs)[源代码]

在指定的轴上使用一个或多个操作进行聚合。

此文档字符串是从 pandas.core.resample.Resampler.agg 复制而来的。

Dask 版本可能存在一些不一致性。

参数
函数函数, 字符串, 列表或字典

用于聚合数据的函数。如果是一个函数,必须能够在传递DataFrame时工作,或者在传递给DataFrame.apply时工作。

接受的组合有:

  • 函数

  • 字符串函数名称

  • 函数列表和/或函数名称,例如 [np.sum, 'mean']

  • 轴标签字典 -> 函数、函数名或此类列表。

*args

传递给 func 的位置参数。

**kwargs

传递给 func 的关键字参数。

返回
标量, 序列 或 数据框

返回可以是:

  • 标量 : 当使用单个函数调用 Series.agg 时

  • Series : 当 DataFrame.agg 被调用时使用单个函数

  • DataFrame : 当使用多个函数调用 DataFrame.agg 时

参见

DataFrame.groupby.aggregate

使用可调用对象、字符串、字典或字符串/可调用对象列表进行聚合。

DataFrame.resample.transform

基于给定的函数对每个组中的序列进行转换。

DataFrame.aggregate

在指定的轴上使用一个或多个操作进行聚合。

注释

聚合操作总是沿着一个轴进行,要么是索引(默认)要么是列轴。这种行为与 numpy 聚合函数(meanmedianprodsumstdvar)不同,后者的默认行为是计算展平数组的聚合,例如 numpy.mean(arr_2d) 而不是 numpy.mean(arr_2d, axis=0)

aggaggregate 的别名。使用该别名。

修改传入对象的函数可能会产生意外行为或错误,并且不受支持。更多详情请参见 Mutating with User Defined Function (UDF) methods

传递的用户定义函数将传递一个 Series 进行评估。

示例

>>> s = pd.Series([1, 2, 3, 4, 5],  
...               index=pd.date_range('20130101', periods=5, freq='s'))
>>> s  
2013-01-01 00:00:00    1
2013-01-01 00:00:01    2
2013-01-01 00:00:02    3
2013-01-01 00:00:03    4
2013-01-01 00:00:04    5
Freq: s, dtype: int64
>>> r = s.resample('2s')  
>>> r.agg("sum")  
2013-01-01 00:00:00    3
2013-01-01 00:00:02    7
2013-01-01 00:00:04    5
Freq: 2s, dtype: int64
>>> r.agg(['sum', 'mean', 'max'])  
                     sum  mean  max
2013-01-01 00:00:00    3   1.5    2
2013-01-01 00:00:02    7   3.5    4
2013-01-01 00:00:04    5   5.0    5
>>> r.agg({'result': lambda x: x.mean() / x.std(),  
...        'total': "sum"})
                       result  total
2013-01-01 00:00:00  2.121320      3
2013-01-01 00:00:02  4.949747      7
2013-01-01 00:00:04       NaN      5
>>> r.agg(average="mean", total="sum")  
                         average  total
2013-01-01 00:00:00      1.5      3
2013-01-01 00:00:02      3.5      7
2013-01-01 00:00:04      5.0      5