dask.dataframe.DataFrame.ffill
dask.dataframe.DataFrame.ffill¶
- DataFrame.ffill(axis=None, limit=None)¶
通过将最后一个有效观测值传播到下一个有效值来填充 NA/NaN 值。
此文档字符串是从 pandas.core.frame.DataFrame.ffill 复制的。
Dask 版本可能存在一些不一致性。
- 参数
- 轴{0 或 ‘index’} 用于 Series,{0 或 ‘index’, 1 或 ‘columns’} 用于 DataFrame
沿其填充缺失值的轴。对于 Series,此参数未使用并默认为 0。
- 就地bool, 默认 False (Dask 中不支持)
如果为真,就地填充。注意:这将修改此对象的任何其他视图(例如,DataFrame中列的非复制切片)。
- 限制int, 默认 None
如果指定了方法,这是要向前/向后填充的连续 NaN 值的最大数量。换句话说,如果存在超过此数量的连续 NaN 的间隙,它将仅部分填充。如果未指定方法,这是沿整个轴填充 NaN 的最大条目数。如果值不为 None,则必须大于 0。
- limit_area : {None, ‘inside’, ‘outside’}, 默认 None (Dask 不支持)
toctree
是一个 reStructuredText 指令 ,这是一个非常多功能的标记。指令可以有参数、选项和内容。 如果指定了限制,连续的 NaN 将被此限制填充。
None
: 无填充限制。‘inside’: 仅填充被有效值包围的NaN(插值)。
‘outside’: 仅填充有效值之外的NaN(外推)。
2.2.0 新版功能.
- 向下转换dict, 默认是 None (Dask 中不支持)
一个字典,键为项目,值为要向下转换的数据类型,或者字符串 ‘infer’,表示尝试向下转换为适当的等价类型(例如,如果可能的话,将 float64 转换为 int64)。
2.2.0 版后已移除.
- 返回
- Series/DataFrame 或 None
如果
inplace=True
,则填充缺失值的对象或 None。
示例
>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0], ... [3, 4, np.nan, 1], ... [np.nan, np.nan, np.nan, np.nan], ... [np.nan, 3, np.nan, 4]], ... columns=list("ABCD")) >>> df A B C D 0 NaN 2.0 NaN 0.0 1 3.0 4.0 NaN 1.0 2 NaN NaN NaN NaN 3 NaN 3.0 NaN 4.0
>>> df.ffill() A B C D 0 NaN 2.0 NaN 0.0 1 3.0 4.0 NaN 1.0 2 3.0 4.0 NaN 1.0 3 3.0 3.0 NaN 4.0
>>> ser = pd.Series([1, np.nan, 2, 3]) >>> ser.ffill() 0 1.0 1 1.0 2 2.0 3 3.0 dtype: float64