dask.dataframe.groupby.SeriesGroupBy.size

dask.dataframe.groupby.SeriesGroupBy.size¶

SeriesGroupBy.size(split_every=None, split_out=1, shuffle_method=None)¶

计算组大小。

此文档字符串是从 pandas.core.groupby.groupby.GroupBy.size 复制的。

Dask 版本可能存在一些不一致性。

返回

DataFrame 或 Series: 如果 as_index 为 True，则为每个组的行数作为一个 Series；如果 as_index 为 False，则为每个组的行数作为一个 DataFrame。

参见

Series.groupby: 对一个 Series 应用 groupby 函数。
DataFrame.groupby: 对DataFrame的每一行或每一列应用一个groupby函数。

示例

对于 SeriesGroupBy:

>>> lst = ['a', 'a', 'b']  
>>> ser = pd.Series([1, 2, 3], index=lst)  
>>> ser  
a     1
a     2
b     3
dtype: int64
>>> ser.groupby(level=0).size()  
a    2
b    1
dtype: int64

>>> data = [[1, 2, 3], [1, 5, 6], [7, 8, 9]]  
>>> df = pd.DataFrame(data, columns=["a", "b", "c"],  
...                   index=["owl", "toucan", "eagle"])
>>> df  
        a  b  c
owl     1  2  3
toucan  1  5  6
eagle   7  8  9
>>> df.groupby("a").size()  
a
1    2
7    1
dtype: int64

对于重采样器：

>>> ser = pd.Series([1, 2, 3], index=pd.DatetimeIndex(  
...                 ['2023-01-01', '2023-01-15', '2023-02-01']))
>>> ser  
2023-01-01    1
2023-01-15    2
2023-02-01    3
dtype: int64
>>> ser.resample('MS').size()  
2023-01-01    2
2023-02-01    1
Freq: MS, dtype: int64

dask.dataframe.groupby.SeriesGroupBy.nunique

dask.dataframe.groupby.SeriesGroupBy.std