dask.dataframe.tseries.resample.Resampler.median

dask.dataframe.tseries.resample.Resampler.median

Resampler.median()[源代码]

计算各组的中位数,排除缺失值。

此文档字符串是从 pandas.core.resample.Resampler.median 复制而来的。

Dask 版本可能存在一些不一致性。

对于多个分组,结果索引将是 MultiIndex

参数
仅数值bool, 默认 False (Dask 中不支持)

仅包含浮点数、整数、布尔类型的列。

在 2.0.0 版更改: numeric_only 不再接受 None 并且默认值为 False。

返回
Series 或 DataFrame

每个组内值的中位数。

示例

对于 SeriesGroupBy:

>>> lst = ['a', 'a', 'a', 'b', 'b', 'b']  
>>> ser = pd.Series([7, 2, 8, 4, 3, 3], index=lst)  
>>> ser  
a     7
a     2
a     8
b     4
b     3
b     3
dtype: int64
>>> ser.groupby(level=0).median()  
a    7.0
b    3.0
dtype: float64

对于 DataFrameGroupBy:

>>> data = {'a': [1, 3, 5, 7, 7, 8, 3], 'b': [1, 4, 8, 4, 4, 2, 1]}  
>>> df = pd.DataFrame(data, index=['dog', 'dog', 'dog',  
...                   'mouse', 'mouse', 'mouse', 'mouse'])
>>> df  
         a  b
  dog    1  1
  dog    3  4
  dog    5  8
mouse    7  4
mouse    7  4
mouse    8  2
mouse    3  1
>>> df.groupby(level=0).median()  
         a    b
dog    3.0  4.0
mouse  7.0  3.0

对于重采样器:

>>> ser = pd.Series([1, 2, 3, 3, 4, 5],  
...                 index=pd.DatetimeIndex(['2023-01-01',
...                                         '2023-01-10',
...                                         '2023-01-15',
...                                         '2023-02-01',
...                                         '2023-02-10',
...                                         '2023-02-15']))
>>> ser.resample('MS').median()  
2023-01-01    2.0
2023-02-01    4.0
Freq: MS, dtype: float64