dask.dataframe.DataFrame.itertuples
dask.dataframe.DataFrame.itertuples¶
- DataFrame.itertuples(index=True, name='Pandas')[源代码]¶
将 DataFrame 行作为命名元组进行迭代。
此文档字符串是从 pandas.core.frame.DataFrame.itertuples 复制的。
Dask 版本可能存在一些不一致性。
- 参数
- 索引bool, 默认 True
如果为真,返回索引作为元组的第一个元素。
- 名称str 或 None, 默认值为 “Pandas”
返回的命名元组的名称,或 None 以返回常规元组。
- 返回
- 迭代器
一个用于迭代 DataFrame 中每一行的 namedtuple 对象,第一个字段可能是索引,后续字段为列值。
参见
DataFrame.iterrows
遍历 DataFrame 行作为 (索引, 系列) 对。
DataFrame.items
遍历 (列名, 系列) 对。
注释
如果列名是无效的 Python 标识符、重复的,或者以下划线开头,它们将被重命名为位置名称。
示例
>>> df = pd.DataFrame({'num_legs': [4, 2], 'num_wings': [0, 2]}, ... index=['dog', 'hawk']) >>> df num_legs num_wings dog 4 0 hawk 2 2 >>> for row in df.itertuples(): ... print(row) ... Pandas(Index='dog', num_legs=4, num_wings=0) Pandas(Index='hawk', num_legs=2, num_wings=2)
通过将 index 参数设置为 False,我们可以移除元组的第一个元素作为索引:
>>> for row in df.itertuples(index=False): ... print(row) ... Pandas(num_legs=4, num_wings=0) Pandas(num_legs=2, num_wings=2)
通过设置 name 参数,我们可以为生成的命名元组设置一个自定义名称:
>>> for row in df.itertuples(name='Animal'): ... print(row) ... Animal(Index='dog', num_legs=4, num_wings=0) Animal(Index='hawk', num_legs=2, num_wings=2)