dask_expr._resample.Resampler.median
dask_expr._resample.Resampler.median¶
- Resampler.median()[源代码]¶
计算各组的中位数,排除缺失值。
此文档字符串是从 pandas.core.resample.Resampler.median 复制而来的。
Dask 版本可能存在一些不一致性。
对于多个分组,结果索引将是 MultiIndex
- 参数
- 仅数值bool, 默认 False (Dask 中不支持)
仅包含浮点数、整数、布尔类型的列。
在 2.0.0 版更改: numeric_only 不再接受
None
并且默认值为 False。
- 返回
- Series 或 DataFrame
每个组内值的中位数。
示例
对于 SeriesGroupBy:
>>> lst = ['a', 'a', 'a', 'b', 'b', 'b'] >>> ser = pd.Series([7, 2, 8, 4, 3, 3], index=lst) >>> ser a 7 a 2 a 8 b 4 b 3 b 3 dtype: int64 >>> ser.groupby(level=0).median() a 7.0 b 3.0 dtype: float64
对于 DataFrameGroupBy:
>>> data = {'a': [1, 3, 5, 7, 7, 8, 3], 'b': [1, 4, 8, 4, 4, 2, 1]} >>> df = pd.DataFrame(data, index=['dog', 'dog', 'dog', ... 'mouse', 'mouse', 'mouse', 'mouse']) >>> df a b dog 1 1 dog 3 4 dog 5 8 mouse 7 4 mouse 7 4 mouse 8 2 mouse 3 1 >>> df.groupby(level=0).median() a b dog 3.0 4.0 mouse 7.0 3.0
对于重采样器:
>>> ser = pd.Series([1, 2, 3, 3, 4, 5], ... index=pd.DatetimeIndex(['2023-01-01', ... '2023-01-10', ... '2023-01-15', ... '2023-02-01', ... '2023-02-10', ... '2023-02-15'])) >>> ser.resample('MS').median() 2023-01-01 2.0 2023-02-01 4.0 Freq: MS, dtype: float64