dask_expr._resample.Resampler.agg
dask_expr._resample.Resampler.agg¶
- Resampler.agg(func, *args, **kwargs)[源代码]¶
在指定的轴上使用一个或多个操作进行聚合。
此文档字符串是从 pandas.core.resample.Resampler.agg 复制而来的。
Dask 版本可能存在一些不一致性。
- 参数
- 函数函数, 字符串, 列表或字典
用于聚合数据的函数。如果是一个函数,必须能够在传递DataFrame时工作,或者在传递给DataFrame.apply时工作。
接受的组合有:
函数
字符串函数名称
函数列表和/或函数名称,例如
[np.sum, 'mean']
轴标签字典 -> 函数、函数名或此类列表。
- *args
传递给 func 的位置参数。
- **kwargs
传递给 func 的关键字参数。
- 返回
- 标量, 序列 或 数据框
返回可以是:
标量 : 当使用单个函数调用 Series.agg 时
Series : 当 DataFrame.agg 被调用时使用单个函数
DataFrame : 当使用多个函数调用 DataFrame.agg 时
参见
DataFrame.groupby.aggregate
使用可调用对象、字符串、字典或字符串/可调用对象列表进行聚合。
DataFrame.resample.transform
基于给定的函数对每个组中的序列进行转换。
DataFrame.aggregate
在指定的轴上使用一个或多个操作进行聚合。
注释
聚合操作总是沿着一个轴进行,要么是索引(默认)要么是列轴。这种行为与 numpy 聚合函数(mean、median、prod、sum、std、var)不同,后者的默认行为是计算展平数组的聚合,例如
numpy.mean(arr_2d)
而不是numpy.mean(arr_2d, axis=0)
。agg 是 aggregate 的别名。使用该别名。
修改传入对象的函数可能会产生意外行为或错误,并且不受支持。更多详情请参见 Mutating with User Defined Function (UDF) methods。
传递的用户定义函数将传递一个 Series 进行评估。
示例
>>> s = pd.Series([1, 2, 3, 4, 5], ... index=pd.date_range('20130101', periods=5, freq='s')) >>> s 2013-01-01 00:00:00 1 2013-01-01 00:00:01 2 2013-01-01 00:00:02 3 2013-01-01 00:00:03 4 2013-01-01 00:00:04 5 Freq: s, dtype: int64
>>> r = s.resample('2s')
>>> r.agg("sum") 2013-01-01 00:00:00 3 2013-01-01 00:00:02 7 2013-01-01 00:00:04 5 Freq: 2s, dtype: int64
>>> r.agg(['sum', 'mean', 'max']) sum mean max 2013-01-01 00:00:00 3 1.5 2 2013-01-01 00:00:02 7 3.5 4 2013-01-01 00:00:04 5 5.0 5
>>> r.agg({'result': lambda x: x.mean() / x.std(), ... 'total': "sum"}) result total 2013-01-01 00:00:00 2.121320 3 2013-01-01 00:00:02 4.949747 7 2013-01-01 00:00:04 NaN 5
>>> r.agg(average="mean", total="sum") average total 2013-01-01 00:00:00 1.5 3 2013-01-01 00:00:02 3.5 7 2013-01-01 00:00:04 5.0 5