dask.dataframe.groupby.DataFrameGroupBy.rolling
dask.dataframe.groupby.DataFrameGroupBy.rolling¶
- DataFrameGroupBy.rolling(window, min_periods=None, center=False, win_type=None, axis=0)¶
提供滚动变换功能。
备注
由于 Dask 对 MultiIndexes 的支持不够完善,此方法返回一个与原始数据具有相同索引的数据框。groupby 列不会像 pandas 那样作为索引的第一级添加。
此方法与其他分组方法的工作方式不同。它对每个分区进行分组(加上一些重叠)。这意味着输出与原始数据具有相同的形状和分区数量。
- 参数
- 窗口str, offset
移动窗口的大小。这是用于计算统计量的观测值数量。数据必须有一个
DatetimeIndex
- min_periodsint, 默认 None
窗口中所需的最小观测数以获得一个值(否则结果为NA)。
- 中心布尔值,默认 False
将标签设置在窗口的中心。
- win_type字符串,默认 None
提供一个窗口类型。识别的窗口类型与 pandas 相同。
- 轴int, 默认值为 0
- 返回
- 一个滚动对象,用于调用计算统计量的方法
示例
>>> import dask >>> ddf = dask.datasets.timeseries(freq="1h") >>> result = ddf.groupby("name").x.rolling('1D').max()