pandas.core.groupby.SeriesGroupBy.sem#
- SeriesGroupBy.sem(ddof=1, numeric_only=False)[源代码]#
计算各组均值的标准误差,排除缺失值。
对于多个分组,结果索引将是 MultiIndex。
- 参数:
- ddofint, 默认 1
自由度。
- numeric_only布尔值, 默认为 False
仅包含 float, int 或 boolean 数据。
Added in version 1.5.0.
在 2.0.0 版本发生变更: numeric_only 现在默认为
False
。
- 返回:
- 系列或数据框
每个组内值的平均标准误差。
例子
对于 SeriesGroupBy:
>>> lst = ["a", "a", "b", "b"] >>> ser = pd.Series([5, 10, 8, 14], index=lst) >>> ser a 5 a 10 b 8 b 14 dtype: int64 >>> ser.groupby(level=0).sem() a 2.5 b 3.0 dtype: float64
对于 DataFrameGroupBy:
>>> data = [[1, 12, 11], [1, 15, 2], [2, 5, 8], [2, 6, 12]] >>> df = pd.DataFrame( ... data, ... columns=["a", "b", "c"], ... index=["tuna", "salmon", "catfish", "goldfish"], ... ) >>> df a b c tuna 1 12 11 salmon 1 15 2 catfish 2 5 8 goldfish 2 6 12 >>> df.groupby("a").sem() b c a 1 1.5 4.5 2 0.5 2.0
对于重采样器:
>>> ser = pd.Series( ... [1, 3, 2, 4, 3, 8], ... index=pd.DatetimeIndex( ... [ ... "2023-01-01", ... "2023-01-10", ... "2023-01-15", ... "2023-02-01", ... "2023-02-10", ... "2023-02-15", ... ] ... ), ... ) >>> ser.resample("MS").sem() 2023-01-01 0.577350 2023-02-01 1.527525 Freq: MS, dtype: float64