dask.dataframe.groupby.DataFrameGroupBy.idxmax

dask.dataframe.groupby.DataFrameGroupBy.idxmax

DataFrameGroupBy.idxmax(split_every=None, split_out=1, shuffle_method=None, axis=_NoDefault.no_default, skipna=True, numeric_only=_NoDefault.no_default)

返回请求轴上最大值的第一个出现的索引。

此文档字符串是从 pandas.core.frame.DataFrame.idxmax 复制的。

Dask 版本可能存在一些不一致性。

NA/null 值被排除。

参数
{0 或 ‘index’, 1 或 ‘columns’}, 默认 0

要使用的轴。0 或 ‘index’ 表示按行,1 或 ‘columns’ 表示按列。

skipnabool, 默认 True

排除NA/空值。如果整行/整列都是NA,结果将是NA。

仅数值bool, 默认 False

只包含 floatintboolean 数据。

1.5.0 新版功能.

返回
系列

沿指定轴的最大值索引。

Raises
ValueError
  • 如果行/列是空的

参见

Series.idxmax

返回最大元素的索引。

注释

此方法是 ndarray.argmax 的 DataFrame 版本。

示例

考虑一个包含阿根廷食品消费的数据集。

>>> df = pd.DataFrame({'consumption': [10.51, 103.11, 55.48],  
...                     'co2_emissions': [37.2, 19.66, 1712]},
...                   index=['Pork', 'Wheat Products', 'Beef'])
>>> df  
                consumption  co2_emissions
Pork                  10.51         37.20
Wheat Products       103.11         19.66
Beef                  55.48       1712.00

默认情况下,它返回每一列中最大值的索引。

>>> df.idxmax()  
consumption     Wheat Products
co2_emissions             Beef
dtype: object

要返回每行中最大值的索引,请使用 axis="columns"

>>> df.idxmax(axis="columns")  
Pork              co2_emissions
Wheat Products     consumption
Beef              co2_emissions
dtype: object