pandas.DataFrame.pivot#
- DataFrame.pivot(*, columns, index=<no_default>, values=<no_default>)[源代码][源代码]#
返回按给定索引/列值组织的重塑DataFrame。
重塑数据(生成一个“透视”表)基于列值。使用指定 index / columns 中的唯一值来形成结果 DataFrame 的轴。此函数不支持数据聚合,多个值将导致列中出现 MultiIndex。有关重塑的更多信息,请参阅 用户指南。
- 参数:
- 列str 或对象或 str 的列表
用于创建新框架列的列。
- 索引str 或对象或 str 列表,可选
用于创建新框架索引的列。如果未指定,则使用现有索引。
- 值str, 对象 或 前述内容的列表,可选
用于填充新框架值的列。如果未指定,将使用所有剩余列,结果将具有层次索引的列。
- 返回:
- DataFrame
返回重塑后的 DataFrame。
- 引发:
- ValueError:
当有任何 index, columns 组合具有多个值时。DataFrame.pivot_table 当你需要聚合时。
参见
DataFrame.pivot_table
可以处理一个索引/列对中重复值的枢轴泛化。
DataFrame.unstack
基于索引值而不是列进行透视。
wide_to_long
宽面板转换为长格式。不如melt灵活,但比melt更用户友好。
备注
对于更精细的控制,请参阅层次索引文档以及相关的 stack/unstack 方法。
更多示例请参考 用户指南。
例子
>>> df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', ... 'two'], ... 'bar': ['A', 'B', 'C', 'A', 'B', 'C'], ... 'baz': [1, 2, 3, 4, 5, 6], ... 'zoo': ['x', 'y', 'z', 'q', 'w', 't']}) >>> df foo bar baz zoo 0 one A 1 x 1 one B 2 y 2 one C 3 z 3 two A 4 q 4 two B 5 w 5 two C 6 t
>>> df.pivot(index='foo', columns='bar', values='baz') bar A B C foo one 1 2 3 two 4 5 6
>>> df.pivot(index='foo', columns='bar')['baz'] bar A B C foo one 1 2 3 two 4 5 6
>>> df.pivot(index='foo', columns='bar', values=['baz', 'zoo']) baz zoo bar A B C A B C foo one 1 2 3 x y z two 4 5 6 q w t
你也可以分配一个列名列表或一个索引名列表。
>>> df = pd.DataFrame({ ... "lev1": [1, 1, 1, 2, 2, 2], ... "lev2": [1, 1, 2, 1, 1, 2], ... "lev3": [1, 2, 1, 2, 1, 2], ... "lev4": [1, 2, 3, 4, 5, 6], ... "values": [0, 1, 2, 3, 4, 5]}) >>> df lev1 lev2 lev3 lev4 values 0 1 1 1 1 0 1 1 1 2 2 1 2 1 2 1 3 2 3 2 1 2 4 3 4 2 1 1 5 4 5 2 2 2 6 5
>>> df.pivot(index="lev1", columns=["lev2", "lev3"], values="values") lev2 1 2 lev3 1 2 1 2 lev1 1 0.0 1.0 2.0 NaN 2 4.0 3.0 NaN 5.0
>>> df.pivot(index=["lev1", "lev2"], columns=["lev3"], values="values") lev3 1 2 lev1 lev2 1 1 0.0 1.0 2 2.0 NaN 2 1 4.0 3.0 2 NaN 5.0
如果存在任何重复项,则会引发 ValueError。
>>> df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'], ... "bar": ['A', 'A', 'B', 'C'], ... "baz": [1, 2, 3, 4]}) >>> df foo bar baz 0 one A 1 1 one A 2 2 two B 3 3 two C 4
请注意,前两行对于我们的 index 和 columns 参数是相同的。
>>> df.pivot(index='foo', columns='bar', values='baz') Traceback (most recent call last): ... ValueError: Index contains duplicate entries, cannot reshape