dask.dataframe.DataFrame.itertuples

dask.dataframe.DataFrame.itertuples¶

DataFrame.itertuples(index=True, name='Pandas')[源代码]¶

将 DataFrame 行作为命名元组进行迭代。

此文档字符串是从 pandas.core.frame.DataFrame.itertuples 复制的。

Dask 版本可能存在一些不一致性。

参数

索引bool, 默认 True: 如果为真，返回索引作为元组的第一个元素。
名称str 或 None, 默认值为 “Pandas”: 返回的命名元组的名称，或 None 以返回常规元组。

返回

迭代器: 一个用于迭代 DataFrame 中每一行的 namedtuple 对象，第一个字段可能是索引，后续字段为列值。

参见

DataFrame.iterrows: 遍历 DataFrame 行作为 (索引, 系列) 对。
DataFrame.items: 遍历 (列名, 系列) 对。

注释

如果列名是无效的 Python 标识符、重复的，或者以下划线开头，它们将被重命名为位置名称。

示例

>>> df = pd.DataFrame({'num_legs': [4, 2], 'num_wings': [0, 2]},  
...                   index=['dog', 'hawk'])
>>> df  
      num_legs  num_wings
dog          4          0
hawk         2          2
>>> for row in df.itertuples():  
...     print(row)
...
Pandas(Index='dog', num_legs=4, num_wings=0)
Pandas(Index='hawk', num_legs=2, num_wings=2)

通过将 index 参数设置为 False，我们可以移除元组的第一个元素作为索引：

>>> for row in df.itertuples(index=False):  
...     print(row)
...
Pandas(num_legs=4, num_wings=0)
Pandas(num_legs=2, num_wings=2)

通过设置 name 参数，我们可以为生成的命名元组设置一个自定义名称：

>>> for row in df.itertuples(name='Animal'):  
...     print(row)
...
Animal(Index='dog', num_legs=4, num_wings=0)
Animal(Index='hawk', num_legs=2, num_wings=2)

dask.dataframe.DataFrame.iterrows

dask.dataframe.DataFrame.join