dask.dataframe.groupby.SeriesGroupBy.rolling

dask.dataframe.groupby.SeriesGroupBy.rolling

SeriesGroupBy.rolling(window, min_periods=None, center=False, win_type=None, axis=0)

提供滚动变换功能。

备注

由于 Dask 对 MultiIndexes 的支持不够完善,此方法返回一个与原始数据具有相同索引的数据框。groupby 列不会像 pandas 那样作为索引的第一级添加。

此方法与其他分组方法的工作方式不同。它对每个分区进行分组(加上一些重叠)。这意味着输出与原始数据具有相同的形状和分区数量。

参数
窗口str, offset

移动窗口的大小。这是用于计算统计量的观测值数量。数据必须有一个 DatetimeIndex

min_periodsint, 默认 None

窗口中所需的最小观测数以获得一个值(否则结果为NA)。

中心布尔值,默认 False

将标签设置在窗口的中心。

win_type字符串,默认 None

提供一个窗口类型。识别的窗口类型与 pandas 相同。

int, 默认值为 0
返回
一个滚动对象,用于调用计算统计量的方法

示例

>>> import dask
>>> ddf = dask.datasets.timeseries(freq="1h")
>>> result = ddf.groupby("name").x.rolling('1D').max()