dask_expr._collection.DataFrame.dropna

dask_expr._collection.DataFrame.dropna¶

DataFrame.dropna(how=_NoDefault.no_default, subset=None, thresh=_NoDefault.no_default)[源代码]¶

移除缺失值。

此文档字符串是从 pandas.core.frame.DataFrame.dropna 复制而来的。

Dask 版本可能存在一些不一致性。

更多关于哪些值被视为缺失，以及如何处理缺失数据的信息，请参阅用户指南。

参数

轴{0 或 ‘index’, 1 或 ‘columns’}, 默认 0 (在 Dask 中不支持)

确定是否删除包含缺失值的行或列。

0, 或 ‘index’ : 删除包含缺失值的行。
1, 或 ‘columns’ : 删除包含缺失值的列。

只允许单个轴。

如何{‘any’, ‘all’}, 默认 ‘any’

确定在至少有一个 NA 或所有 NA 的情况下，是否从 DataFrame 中删除行或列。

‘any’ : 如果存在任何 NA 值，则删除该行或列。
‘all’ : 如果所有值均为NA，则删除该行或列。

threshint, 可选

要求许多非NA值。不能与how结合使用。

子集列标签或标签序列，可选

考虑其他轴的标签，例如，如果您正在删除行，这些将是包含的列的列表。

就地bool, 默认 False (Dask 中不支持)

是否修改 DataFrame 而不是创建一个新的。

ignore_index : bool, 默认为 False (Dask 不支持)布尔值，默认

如果 True ，生成的轴将被标记为 0, 1, …, n - 1。

2.0.0 新版功能.

返回

DataFrame 或 None: 删除了NA条目的DataFrame，如果 inplace=True 则为None。

参见

DataFrame.isna: 指示缺失值。
DataFrame.notna: 指示现有（非缺失）的值。
DataFrame.fillna: 替换缺失值。
Series.dropna: 删除缺失值。
Index.dropna: 删除缺失的索引。

示例

>>> df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],  
...                    "toy": [np.nan, 'Batmobile', 'Bullwhip'],
...                    "born": [pd.NaT, pd.Timestamp("1940-04-25"),
...                             pd.NaT]})
>>> df  
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

删除至少有一个元素缺失的行。

>>> df.dropna()  
     name        toy       born
1  Batman  Batmobile 1940-04-25

删除至少有一个元素缺失的列。

>>> df.dropna(axis='columns')  
       name
0    Alfred
1    Batman
2  Catwoman

删除所有元素缺失的行。

>>> df.dropna(how='all')  
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

仅保留至少有2个非NA值的行。

>>> df.dropna(thresh=2)  
       name        toy       born
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

定义在哪些列中查找缺失值。

>>> df.dropna(subset=['name', 'toy'])  
       name        toy       born
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

dask_expr._collection.DataFrame.drop_duplicates

dask_expr._collection.DataFrame.dtypes