dask.dataframe.groupby.SeriesGroupBy.idxmax
dask.dataframe.groupby.SeriesGroupBy.idxmax¶
- SeriesGroupBy.idxmax(split_every=None, split_out=1, shuffle_method=None, axis=_NoDefault.no_default, skipna=True, numeric_only=_NoDefault.no_default)¶
返回请求轴上最大值的第一个出现的索引。
此文档字符串是从 pandas.core.frame.DataFrame.idxmax 复制的。
Dask 版本可能存在一些不一致性。
NA/null 值被排除。
- 参数
- 轴{0 或 ‘index’, 1 或 ‘columns’}, 默认 0
要使用的轴。0 或 ‘index’ 表示按行,1 或 ‘columns’ 表示按列。
- skipnabool, 默认 True
排除NA/空值。如果整行/整列都是NA,结果将是NA。
- 仅数值bool, 默认 False
只包含 float、int 或 boolean 数据。
1.5.0 新版功能.
- 返回
- 系列
沿指定轴的最大值索引。
- Raises
- ValueError
如果行/列是空的
参见
Series.idxmax
返回最大元素的索引。
注释
此方法是
ndarray.argmax
的 DataFrame 版本。示例
考虑一个包含阿根廷食品消费的数据集。
>>> df = pd.DataFrame({'consumption': [10.51, 103.11, 55.48], ... 'co2_emissions': [37.2, 19.66, 1712]}, ... index=['Pork', 'Wheat Products', 'Beef'])
>>> df consumption co2_emissions Pork 10.51 37.20 Wheat Products 103.11 19.66 Beef 55.48 1712.00
默认情况下,它返回每一列中最大值的索引。
>>> df.idxmax() consumption Wheat Products co2_emissions Beef dtype: object
要返回每行中最大值的索引,请使用
axis="columns"
。>>> df.idxmax(axis="columns") Pork co2_emissions Wheat Products consumption Beef co2_emissions dtype: object