dask_expr._collection.DataFrame.dropna
dask_expr._collection.DataFrame.dropna¶
- DataFrame.dropna(how=_NoDefault.no_default, subset=None, thresh=_NoDefault.no_default)[源代码]¶
移除缺失值。
此文档字符串是从 pandas.core.frame.DataFrame.dropna 复制而来的。
Dask 版本可能存在一些不一致性。
更多关于哪些值被视为缺失,以及如何处理缺失数据的信息,请参阅 用户指南。
- 参数
- 轴{0 或 ‘index’, 1 或 ‘columns’}, 默认 0 (在 Dask 中不支持)
确定是否删除包含缺失值的行或列。
0, 或 ‘index’ : 删除包含缺失值的行。
1, 或 ‘columns’ : 删除包含缺失值的列。
只允许单个轴。
- 如何{‘any’, ‘all’}, 默认 ‘any’
确定在至少有一个 NA 或所有 NA 的情况下,是否从 DataFrame 中删除行或列。
‘any’ : 如果存在任何 NA 值,则删除该行或列。
‘all’ : 如果所有值均为NA,则删除该行或列。
- threshint, 可选
要求许多非NA值。不能与how结合使用。
- 子集列标签或标签序列,可选
考虑其他轴的标签,例如,如果您正在删除行,这些将是包含的列的列表。
- 就地bool, 默认 False (Dask 中不支持)
是否修改 DataFrame 而不是创建一个新的。
- ignore_index : bool, 默认为
False
(Dask 不支持)布尔值,默认 如果
True
,生成的轴将被标记为 0, 1, …, n - 1。2.0.0 新版功能.
- 返回
- DataFrame 或 None
删除了NA条目的DataFrame,如果
inplace=True
则为None。
参见
DataFrame.isna
指示缺失值。
DataFrame.notna
指示现有(非缺失)的值。
DataFrame.fillna
替换缺失值。
Series.dropna
删除缺失值。
Index.dropna
删除缺失的索引。
示例
>>> df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'], ... "toy": [np.nan, 'Batmobile', 'Bullwhip'], ... "born": [pd.NaT, pd.Timestamp("1940-04-25"), ... pd.NaT]}) >>> df name toy born 0 Alfred NaN NaT 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT
删除至少有一个元素缺失的行。
>>> df.dropna() name toy born 1 Batman Batmobile 1940-04-25
删除至少有一个元素缺失的列。
>>> df.dropna(axis='columns') name 0 Alfred 1 Batman 2 Catwoman
删除所有元素缺失的行。
>>> df.dropna(how='all') name toy born 0 Alfred NaN NaT 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT
仅保留至少有2个非NA值的行。
>>> df.dropna(thresh=2) name toy born 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT
定义在哪些列中查找缺失值。
>>> df.dropna(subset=['name', 'toy']) name toy born 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT