GroupBy#

pandas.api.typing.DataFrameGroupBy 和 pandas.api.typing.SeriesGroupBy 实例由 groupby 调用 pandas.DataFrame.groupby() 和 pandas.Series.groupby() 分别返回。

索引，迭代#

`DataFrameGroupBy.__iter__`()	Groupby 迭代器。
`SeriesGroupBy.__iter__`()	Groupby 迭代器。
`DataFrameGroupBy.groups`	字典 {组名 -> 组标签}。
`SeriesGroupBy.groups`	字典 {组名 -> 组标签}。
`DataFrameGroupBy.indices`	字典 {组名 -> 组索引}。
`SeriesGroupBy.indices`	字典 {组名 -> 组索引}。
`DataFrameGroupBy.get_group`(名称)	从具有提供名称的组构造 DataFrame。
`SeriesGroupBy.get_group`(名称)	从具有提供名称的组构造 DataFrame。

分组器(*args, **kwargs)

Grouper 允许用户为对象指定一个 groupby 指令。

函数应用助手#

NamedAgg(column, aggfunc)

用于列特定聚合的辅助工具，可控制输出列名称。

函数应用#

`SeriesGroupBy.apply`(func, args, *kwargs)	按组应用函数 `func` 并将结果合并在一起。
`DataFrameGroupBy.apply`(func, *args[, ...])	按组应用函数 `func` 并将结果合并在一起。
`SeriesGroupBy.agg`([func, engine, engine_kwargs])	使用一个或多个操作进行聚合。
`DataFrameGroupBy.agg`([func, engine, ...])	使用一个或多个操作进行聚合。
`SeriesGroupBy.aggregate`([func, engine, ...])	使用一个或多个操作进行聚合。
`DataFrameGroupBy.aggregate`([func, engine, ...])	使用一个或多个操作进行聚合。
`SeriesGroupBy.transform`(func, *args[, ...])	在每个组上调用生成相同索引序列的函数。
`DataFrameGroupBy.transform`(func, *args[, ...])	在每个组上调用生成相同索引的DataFrame的函数。
`SeriesGroupBy.pipe`(func, args, *kwargs)	将 `func` 及其参数应用于此 GroupBy 对象并返回其结果。
`DataFrameGroupBy.pipe`(func, args, *kwargs)	将 `func` 及其参数应用于此 GroupBy 对象并返回其结果。
`DataFrameGroupBy.filter`(func[, dropna])	从不满足条件的组中过滤元素。
`SeriesGroupBy.filter`(func[, dropna])	从不满足条件的组中过滤元素。

`DataFrameGroupBy` 计算 / 描述性统计#

`DataFrameGroupBy.all`([skipna])	如果组中的所有值都是真实的，则返回 True，否则返回 False。
`DataFrameGroupBy.any`([skipna])	如果在组中的任何值是真实的，则返回 True，否则返回 False。
`DataFrameGroupBy.bfill`([limit])	向后填充值。
`DataFrameGroupBy.corr`([method, min_periods, ...])	计算列之间的成对相关性，排除NA/null值。
`DataFrameGroupBy.corrwith`(other[, drop, ...])	(已弃用) 计算成对相关性。
`DataFrameGroupBy.count`()	计算组的数量，排除缺失值。
`DataFrameGroupBy.cov`([min_periods, ddof, ...])	计算列之间的成对协方差，排除NA/null值。
`DataFrameGroupBy.cumcount`([ascending])	每个组中的每个项目从0到该组长度减1进行编号。
`DataFrameGroupBy.cummax`([numeric_only])	每个组的累积最大值。
`DataFrameGroupBy.cummin`([numeric_only])	每个组的累积最小值。
`DataFrameGroupBy.cumprod`([numeric_only])	每个组的累积乘积。
`DataFrameGroupBy.cumsum`([numeric_only])	每个组的累积和。
`DataFrameGroupBy.describe`([percentiles, ...])	生成描述性统计数据。
`DataFrameGroupBy.diff`([periods])	元素的第一个离散差分。
`DataFrameGroupBy.ffill`([limit])	向前填充值。
`DataFrameGroupBy.first`([numeric_only, ...])	计算每个组内每一列的第一个条目。
`DataFrameGroupBy.head`([n])	返回每个组的前 n 行。
`DataFrameGroupBy.idxmax`([skipna, numeric_only])	返回每个组中最大值的首次出现的索引。
`DataFrameGroupBy.idxmin`([skipna, numeric_only])	返回每个组中最小值的第一个出现的索引。
`DataFrameGroupBy.last`([numeric_only, ...])	计算每个组内每一列的最后一个条目。
`DataFrameGroupBy.max`([numeric_only, ...])	计算组值的最大值。
`DataFrameGroupBy.mean`([numeric_only, ...])	计算各组的均值，排除缺失值。
`DataFrameGroupBy.median`([numeric_only])	计算各组的中位数，排除缺失值。
`DataFrameGroupBy.min`([numeric_only, ...])	计算组值的最小值。
`DataFrameGroupBy.ngroup`([ascending])	从0到组数减1的每个组编号。
`DataFrameGroupBy.nth`	如果 n 是整数，则从每个组中取第 n 行，否则取行的子集。
`DataFrameGroupBy.nunique`([dropna])	返回包含每个位置中唯一元素计数的 DataFrame。
`DataFrameGroupBy.ohlc`()	计算一组的开盘、最高、最低和收盘值，排除缺失值。
`DataFrameGroupBy.pct_change`([periods, ...])	计算组中每个值相对于前一个条目的 pct_change。
`DataFrameGroupBy.prod`([numeric_only, min_count])	计算组值的乘积。
`DataFrameGroupBy.quantile`([q, ...])	返回给定分位数的组值，类似于 numpy.percentile。
`DataFrameGroupBy.rank`([method, ascending, ...])	提供每个组内值的排名。
`DataFrameGroupBy.resample`(规则, *参数[, ...])	在使用 TimeGrouper 时提供重采样。
`DataFrameGroupBy.rolling`(window[, ...])	返回一个滚动分组器，为每个组提供滚动功能。
`DataFrameGroupBy.sample`([n, frac, replace, ...])	从每个组中返回一个随机样本项。
`DataFrameGroupBy.sem`([ddof, numeric_only])	计算组的标准误差，排除缺失值。
`DataFrameGroupBy.shift`([periods, freq, ...])	将每个组按周期观察值进行移位。
`DataFrameGroupBy.size`()	计算组大小。
`DataFrameGroupBy.skew`([skipna, numeric_only])	返回组内的无偏斜度。
`DataFrameGroupBy.std`([ddof, engine, ...])	计算组的标准偏差，排除缺失值。
`DataFrameGroupBy.sum`([numeric_only, ...])	计算组值的总和。
`DataFrameGroupBy.var`([ddof, engine, ...])	计算组的方差，排除缺失值。
`DataFrameGroupBy.tail`([n])	返回每个组的最后 n 行。
`DataFrameGroupBy.take`(indices, **kwargs)	返回每个组中给定的位置索引中的元素。
`DataFrameGroupBy.value_counts`([subset, ...])	返回一个包含唯一行计数的 Series 或 DataFrame。

`SeriesGroupBy` 计算 / 描述性统计#

`SeriesGroupBy.all`([skipna])	如果组中的所有值都是真实的，则返回 True，否则返回 False。
`SeriesGroupBy.any`([skipna])	如果在组中的任何值是真实的，则返回 True，否则返回 False。
`SeriesGroupBy.bfill`([limit])	向后填充值。
`SeriesGroupBy.corr`(other[, method, min_periods])	计算与 other Series 的相关性，排除缺失值。
`SeriesGroupBy.count`()	计算组的数量，排除缺失值。
`SeriesGroupBy.cov`(other[, min_periods, ddof])	计算与 Series 的协方差，排除缺失值。
`SeriesGroupBy.cumcount`([ascending])	每个组中的每个项目从0到该组长度减1进行编号。
`SeriesGroupBy.cummax`([numeric_only])	每个组的累积最大值。
`SeriesGroupBy.cummin`([numeric_only])	每个组的累积最小值。
`SeriesGroupBy.cumprod`([numeric_only])	每个组的累积乘积。
`SeriesGroupBy.cumsum`([numeric_only])	每个组的累积和。
`SeriesGroupBy.describe`([percentiles, ...])	生成描述性统计数据。
`SeriesGroupBy.diff`([periods])	元素的第一个离散差分。
`SeriesGroupBy.ffill`([limit])	向前填充值。
`SeriesGroupBy.first`([numeric_only, ...])	计算每个组内每一列的第一个条目。
`SeriesGroupBy.head`([n])	返回每个组的前 n 行。
`SeriesGroupBy.last`([numeric_only, ...])	计算每个组内每一列的最后一个条目。
`SeriesGroupBy.idxmax`([skipna])	返回最大值的行标签。
`SeriesGroupBy.idxmin`([skipna])	返回最小值的行标签。
`SeriesGroupBy.is_monotonic_increasing`	返回每个组的值是否单调递增。
`SeriesGroupBy.is_monotonic_decreasing`	返回每个组的值是否单调递减。
`SeriesGroupBy.max`([numeric_only, min_count, ...])	计算组值的最大值。
`SeriesGroupBy.mean`([numeric_only, engine, ...])	计算各组的均值，排除缺失值。
`SeriesGroupBy.median`([numeric_only])	计算各组的中位数，排除缺失值。
`SeriesGroupBy.min`([numeric_only, min_count, ...])	计算组值的最小值。
`SeriesGroupBy.ngroup`([ascending])	从0到组数减1的每个组编号。
`SeriesGroupBy.nlargest`([n, keep])	返回最大的 n 个元素。
`SeriesGroupBy.nsmallest`([n, keep])	返回最小的 n 个元素。
`SeriesGroupBy.nth`	如果 n 是整数，则从每个组中取第 n 行，否则取行的子集。
`SeriesGroupBy.nunique`([dropna])	返回组中唯一元素的数量。
`SeriesGroupBy.unique`()	为每个组返回唯一值。
`SeriesGroupBy.ohlc`()	计算一组的开盘、最高、最低和收盘值，排除缺失值。
`SeriesGroupBy.pct_change`([periods, ...])	计算组中每个值相对于前一个条目的 pct_change。
`SeriesGroupBy.prod`([numeric_only, min_count])	计算组值的乘积。
`SeriesGroupBy.quantile`([q, interpolation, ...])	返回给定分位数的组值，类似于 numpy.percentile。
`SeriesGroupBy.rank`([method, ascending, ...])	提供每个组内值的排名。
`SeriesGroupBy.resample`(rule, *args[, ...])	在使用 TimeGrouper 时提供重采样。
`SeriesGroupBy.rolling`(窗口[, 最小周期, ...])	返回一个滚动分组器，为每个组提供滚动功能。
`SeriesGroupBy.sample`([n, frac, replace, ...])	从每个组中返回一个随机样本项。
`SeriesGroupBy.sem`([ddof, numeric_only])	计算组的标准误差，排除缺失值。
`SeriesGroupBy.shift`([periods, freq, ...])	将每个组按周期观察值进行移位。
`SeriesGroupBy.size`()	计算组大小。
`SeriesGroupBy.skew`([skipna, numeric_only])	返回组内的无偏斜度。
`SeriesGroupBy.std`([ddof, engine, ...])	计算组的标准偏差，排除缺失值。
`SeriesGroupBy.sum`([numeric_only, min_count, ...])	计算组值的总和。
`SeriesGroupBy.var`([ddof, engine, ...])	计算组的方差，排除缺失值。
`SeriesGroupBy.tail`([n])	返回每个组的最后 n 行。
`SeriesGroupBy.take`(indices, **kwargs)	返回每个组中给定的位置索引中的元素。
`SeriesGroupBy.value_counts`([normalize, ...])	返回一个包含唯一行计数的 Series 或 DataFrame。

绘图和可视化#

`DataFrameGroupBy.boxplot`([subplots, column, ...])	从 DataFrameGroupBy 数据生成箱形图。
`DataFrameGroupBy.hist`([column, by, grid, ...])	绘制 DataFrame 列的直方图。
`SeriesGroupBy.hist`([by, ax, grid, ...])	使用 matplotlib 绘制输入序列的直方图。
`DataFrameGroupBy.plot`	绘制 Series 或 DataFrame 的图表。
`SeriesGroupBy.plot`	绘制 Series 或 DataFrame 的图表。