pandas.DataFrame.pipe#

DataFrame.pipe(func, *args, **kwargs)[源代码]#

应用期望 Series 或 DataFrames 的可链接函数。

参数:
func函数

要应用于 Series/DataFrame 的函数。argskwargs 被传递给 func。或者是一个 (callable, data_keyword) 元组,其中 data_keyword 是一个字符串,指示 callable 中期望 Series/DataFrame 的关键字。

*args可迭代对象, 可选

传递给 func 的位置参数。

**kwargs映射,可选

传递给 func 的关键字参数的字典。

返回:
func 的返回类型。

func 应用于 Series 或 DataFrame 的结果。

参见

DataFrame.apply

沿 DataFrame 的输入轴应用函数。

DataFrame.map

在整个DataFrame上逐元素应用一个函数。

Series.map

Series 上应用映射对应关系。

备注

在将期望 Series、DataFrames 或 GroupBy 对象的函数链接在一起时使用 .pipe

示例

从字典构建一个收入DataFrame。

>>> data = [[8000, 1000], [9500, np.nan], [5000, 2000]]
>>> df = pd.DataFrame(data, columns=["Salary", "Others"])
>>> df
   Salary  Others
0    8000  1000.0
1    9500     NaN
2    5000  2000.0

对收入DataFrame执行减税功能的函数。

>>> def subtract_federal_tax(df):
...     return df * 0.9
>>> def subtract_state_tax(df, rate):
...     return df * (1 - rate)
>>> def subtract_national_insurance(df, rate, rate_increase):
...     new_rate = rate + rate_increase
...     return df * (1 - new_rate)

而不是写作

>>> subtract_national_insurance(
...     subtract_state_tax(subtract_federal_tax(df), rate=0.12),
...     rate=0.05,
...     rate_increase=0.02,
... )  

你可以写

>>> (
...     df.pipe(subtract_federal_tax)
...     .pipe(subtract_state_tax, rate=0.12)
...     .pipe(subtract_national_insurance, rate=0.05, rate_increase=0.02)
... )
    Salary   Others
0  5892.48   736.56
1  6997.32      NaN
2  3682.80  1473.12

如果你有一个函数,它以数据作为(例如)第二个参数,传递一个元组,指示哪个关键字期望数据。例如,假设 national_insurance 在第二个参数中以 df 作为数据:

>>> def subtract_national_insurance(rate, df, rate_increase):
...     new_rate = rate + rate_increase
...     return df * (1 - new_rate)
>>> (
...     df.pipe(subtract_federal_tax)
...     .pipe(subtract_state_tax, rate=0.12)
...     .pipe(
...         (subtract_national_insurance, "df"), rate=0.05, rate_increase=0.02
...     )
... )
    Salary   Others
0  5892.48   736.56
1  6997.32      NaN
2  3682.80  1473.12