dask.dataframe.DataFrame.itertuples

dask.dataframe.DataFrame.itertuples

DataFrame.itertuples(index=True, name='Pandas')[源代码]

将 DataFrame 行作为命名元组进行迭代。

此文档字符串是从 pandas.core.frame.DataFrame.itertuples 复制的。

Dask 版本可能存在一些不一致性。

参数
索引bool, 默认 True

如果为真,返回索引作为元组的第一个元素。

名称str 或 None, 默认值为 “Pandas”

返回的命名元组的名称,或 None 以返回常规元组。

返回
迭代器

一个用于迭代 DataFrame 中每一行的 namedtuple 对象,第一个字段可能是索引,后续字段为列值。

参见

DataFrame.iterrows

遍历 DataFrame 行作为 (索引, 系列) 对。

DataFrame.items

遍历 (列名, 系列) 对。

注释

如果列名是无效的 Python 标识符、重复的,或者以下划线开头,它们将被重命名为位置名称。

示例

>>> df = pd.DataFrame({'num_legs': [4, 2], 'num_wings': [0, 2]},  
...                   index=['dog', 'hawk'])
>>> df  
      num_legs  num_wings
dog          4          0
hawk         2          2
>>> for row in df.itertuples():  
...     print(row)
...
Pandas(Index='dog', num_legs=4, num_wings=0)
Pandas(Index='hawk', num_legs=2, num_wings=2)

通过将 index 参数设置为 False,我们可以移除元组的第一个元素作为索引:

>>> for row in df.itertuples(index=False):  
...     print(row)
...
Pandas(num_legs=4, num_wings=0)
Pandas(num_legs=2, num_wings=2)

通过设置 name 参数,我们可以为生成的命名元组设置一个自定义名称:

>>> for row in df.itertuples(name='Animal'):  
...     print(row)
...
Animal(Index='dog', num_legs=4, num_wings=0)
Animal(Index='hawk', num_legs=2, num_wings=2)