dask.dataframe.DataFrame.drop

dask.dataframe.DataFrame.drop¶

DataFrame.drop(labels=None, axis=0, columns=None, errors='raise')[源代码]¶

从行或列中删除指定的标签。

此文档字符串是从 pandas.core.frame.DataFrame.drop 复制过来的。

Dask 版本可能存在一些不一致性。

通过指定标签名称和相应的轴，或直接指定索引或列名称来删除行或列。当使用多重索引时，可以通过指定级别来删除不同级别的标签。有关现在未使用的级别的更多信息，请参阅用户指南。

参数

标签单个标签或类列表: 要删除的索引或列标签。元组将被用作单个标签，而不是作为类列表处理。
轴{0 或 ‘index’, 1 或 ‘columns’}, 默认 0: 是否从索引（0 或 ‘index’）或列（1 或 ‘columns’）中删除标签。
索引单个标签或类似列表的（在Dask中不支持）: 指定轴的替代方法（labels, axis=0 等同于 index=labels）。
列单个标签或类列表: 指定轴的替代方法（labels, axis=1 等同于 columns=labels）。
级别整数或级别名称，可选（在Dask中不支持）: 对于 MultiIndex，将从中移除标签的级别。
就地bool, 默认 False (Dask 中不支持): 如果为 False，返回一个副本。否则，就地执行操作并返回 None。
错误{‘ignore’, ‘raise’}, 默认 ‘raise’: 如果为 ‘ignore’，则忽略错误并且仅删除现有的标签。

返回

DataFrame 或 None: 返回 DataFrame 或 None 如果指定了索引或列标签被移除，或者如果 inplace=True 则返回 None。

Raises

KeyError: 如果在选定的轴中找不到任何标签。

参见

DataFrame.loc: 基于标签位置的索引器，用于通过标签进行选择。
DataFrame.dropna: 返回在给定轴上省略了缺失数据（全部或任意）标签的 DataFrame。
DataFrame.drop_duplicates: 返回删除了重复行的 DataFrame，可选地仅考虑某些列。
Series.drop: 返回移除了指定索引标签的系列。

示例

>>> df = pd.DataFrame(np.arange(12).reshape(3, 4),  
...                   columns=['A', 'B', 'C', 'D'])
>>> df  
   A  B   C   D
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

删除列

>>> df.drop(['B', 'C'], axis=1)  
   A   D
0  0   3
1  4   7
2  8  11

>>> df.drop(columns=['B', 'C'])  
   A   D
0  0   3
1  4   7
2  8  11

按索引删除行

>>> df.drop([0, 1])  
   A  B   C   D
2  8  9  10  11

删除 MultiIndex DataFrame 的列和/或行

>>> midx = pd.MultiIndex(levels=[['llama', 'cow', 'falcon'],  
...                              ['speed', 'weight', 'length']],
...                      codes=[[0, 0, 0, 1, 1, 1, 2, 2, 2],
...                             [0, 1, 2, 0, 1, 2, 0, 1, 2]])
>>> df = pd.DataFrame(index=midx, columns=['big', 'small'],  
...                   data=[[45, 30], [200, 100], [1.5, 1], [30, 20],
...                         [250, 150], [1.5, 0.8], [320, 250],
...                         [1, 0.8], [0.3, 0.2]])
>>> df  
                big     small
llama   speed   45.0    30.0
        weight  200.0   100.0
        length  1.5     1.0
cow     speed   30.0    20.0
        weight  250.0   150.0
        length  1.5     0.8
falcon  speed   320.0   250.0
        weight  1.0     0.8
        length  0.3     0.2

从 MultiIndex DataFrame 中删除特定的索引组合，即删除组合 'falcon' 和 'weight'，这将仅删除相应的行。

>>> df.drop(index=('falcon', 'weight'))  
                big     small
llama   speed   45.0    30.0
        weight  200.0   100.0
        length  1.5     1.0
cow     speed   30.0    20.0
        weight  250.0   150.0
        length  1.5     0.8
falcon  speed   320.0   250.0
        length  0.3     0.2

>>> df.drop(index='cow', columns='small')  
                big
llama   speed   45.0
        weight  200.0
        length  1.5
falcon  speed   320.0
        weight  1.0
        length  0.3

>>> df.drop(index='length', level=1)  
                big     small
llama   speed   45.0    30.0
        weight  200.0   100.0
cow     speed   30.0    20.0
        weight  250.0   150.0
falcon  speed   320.0   250.0
        weight  1.0     0.8

dask.dataframe.DataFrame.divide

dask.dataframe.DataFrame.drop_duplicates