pandas.core.groupby.SeriesGroupBy.take#

SeriesGroupBy.take(indices, **kwargs)[源代码][源代码]#

返回每个组中给定的 位置 索引中的元素。

这意味着我们不是根据对象的索引属性中的实际值进行索引。我们是根据元素在对象中的实际位置进行索引。

如果某个组请求的索引不存在,此方法将引发。要获得忽略不存在的索引的类似行为,请参见 SeriesGroupBy.nth()

参数:
索引array-like

一个包含整数的数组,指示在每个组中要取的位置。

**kwargs

为了与 numpy.take() 兼容。对输出没有影响。

返回:
系列

包含从每个组中提取的元素的系列。

参见

Series.take

沿轴从 Series 中提取元素。

Series.loc

通过标签选择DataFrame的一个子集。

Series.iloc

按位置选择DataFrame的一个子集。

numpy.take

沿轴从数组中提取元素。

SeriesGroupBy.nth

类似于take,如果索引不存在则不会引发错误。

例子

>>> df = pd.DataFrame(
...     [
...         ("falcon", "bird", 389.0),
...         ("parrot", "bird", 24.0),
...         ("lion", "mammal", 80.5),
...         ("monkey", "mammal", np.nan),
...         ("rabbit", "mammal", 15.0),
...     ],
...     columns=["name", "class", "max_speed"],
...     index=[4, 3, 2, 1, 0],
... )
>>> df
     name   class  max_speed
4  falcon    bird      389.0
3  parrot    bird       24.0
2    lion  mammal       80.5
1  monkey  mammal        NaN
0  rabbit  mammal       15.0
>>> gb = df["name"].groupby([1, 1, 2, 2, 2])

在每个组中取第0行和第1行的元素。

>>> gb.take([0, 1])
1  4    falcon
   3    parrot
2  2      lion
   1    monkey
Name: name, dtype: object

我们可以使用负整数从对象的末尾开始获取元素,就像使用Python列表一样。

>>> gb.take([-1, -2])
1  3    parrot
   4    falcon
2  0    rabbit
   1    monkey
Name: name, dtype: object