dask.dataframe.DataFrame.ffill

dask.dataframe.DataFrame.ffill

DataFrame.ffill(axis=None, limit=None)

通过将最后一个有效观测值传播到下一个有效值来填充 NA/NaN 值。

此文档字符串是从 pandas.core.frame.DataFrame.ffill 复制的。

Dask 版本可能存在一些不一致性。

参数
{0 或 ‘index’} 用于 Series,{0 或 ‘index’, 1 或 ‘columns’} 用于 DataFrame

沿其填充缺失值的轴。对于 Series,此参数未使用并默认为 0。

就地bool, 默认 False (Dask 中不支持)

如果为真,就地填充。注意:这将修改此对象的任何其他视图(例如,DataFrame中列的非复制切片)。

限制int, 默认 None

如果指定了方法,这是要向前/向后填充的连续 NaN 值的最大数量。换句话说,如果存在超过此数量的连续 NaN 的间隙,它将仅部分填充。如果未指定方法,这是沿整个轴填充 NaN 的最大条目数。如果值不为 None,则必须大于 0。

limit_area : {None, ‘inside’, ‘outside’}, 默认 None (Dask 不支持)toctree 是一个 reStructuredText 指令 ,这是一个非常多功能的标记。指令可以有参数、选项和内容。

如果指定了限制,连续的 NaN 将被此限制填充。

  • None: 无填充限制。

  • ‘inside’: 仅填充被有效值包围的NaN(插值)。

  • ‘outside’: 仅填充有效值之外的NaN(外推)。

2.2.0 新版功能.

向下转换dict, 默认是 None (Dask 中不支持)

一个字典,键为项目,值为要向下转换的数据类型,或者字符串 ‘infer’,表示尝试向下转换为适当的等价类型(例如,如果可能的话,将 float64 转换为 int64)。

2.2.0 版后已移除.

返回
Series/DataFrame 或 None

如果 inplace=True,则填充缺失值的对象或 None。

示例

>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0],  
...                    [3, 4, np.nan, 1],
...                    [np.nan, np.nan, np.nan, np.nan],
...                    [np.nan, 3, np.nan, 4]],
...                   columns=list("ABCD"))
>>> df  
     A    B   C    D
0  NaN  2.0 NaN  0.0
1  3.0  4.0 NaN  1.0
2  NaN  NaN NaN  NaN
3  NaN  3.0 NaN  4.0
>>> df.ffill()  
     A    B   C    D
0  NaN  2.0 NaN  0.0
1  3.0  4.0 NaN  1.0
2  3.0  4.0 NaN  1.0
3  3.0  3.0 NaN  4.0
>>> ser = pd.Series([1, np.nan, 2, 3])  
>>> ser.ffill()  
0   1.0
1   1.0
2   2.0
3   3.0
dtype: float64