pandas.DataFrame.drop#
- DataFrame.drop(labels=None, *, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')[源代码][源代码]#
从行或列中删除指定的标签。
通过指定标签名称和相应的轴,或直接指定索引或列名称,可以删除行或列。使用多索引时,可以通过指定级别来删除不同级别的标签。有关现在未使用的级别的更多信息,请参阅 用户指南。
- 参数:
- 标签单个标签或类似列表
要删除的索引或列标签。一个元组将被用作单个标签,而不是作为类列表处理。
- 轴{0 或 ‘index’, 1 或 ‘columns’},默认 0
是否从索引(0 或 ‘index’)或列(1 或 ‘columns’)中删除标签。
- 索引单个标签或类似列表
指定轴的替代方法(
labels, axis=0
等同于index=labels
)。- 列单个标签或类似列表
指定轴的替代方法(
labels, axis=1
等同于columns=labels
)。- 级别整数或级别名称,可选
对于 MultiIndex,将从中删除标签的级别。
- inplacebool, 默认为 False
如果为 False,返回一个副本。否则,就地执行操作并返回 None。
- 错误{‘ignore’, ‘raise’}, 默认 ‘raise’
如果为 ‘ignore’,则抑制错误并且仅删除现有标签。
- 返回:
- DataFrame 或 None
返回 DataFrame 或 None 如果指定了索引或列标签被移除的 DataFrame,如果 inplace=True 则返回 None。
- 引发:
- KeyError
如果在选定的轴中找不到任何标签。
参见
DataFrame.loc
基于标签位置的索引器,用于按标签选择。
DataFrame.dropna
返回在给定轴上标签缺失数据(全部或任意)被省略的 DataFrame。
DataFrame.drop_duplicates
返回删除了重复行的 DataFrame,可以选择仅考虑某些列。
Series.drop
返回移除了指定索引标签的系列。
例子
>>> df = pd.DataFrame(np.arange(12).reshape(3, 4), columns=["A", "B", "C", "D"]) >>> df A B C D 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11
删除列
>>> df.drop(["B", "C"], axis=1) A D 0 0 3 1 4 7 2 8 11
>>> df.drop(columns=["B", "C"]) A D 0 0 3 1 4 7 2 8 11
按索引删除一行
>>> df.drop([0, 1]) A B C D 2 8 9 10 11
删除 MultiIndex DataFrame 的列和/或行
>>> midx = pd.MultiIndex( ... levels=[["llama", "cow", "falcon"], ["speed", "weight", "length"]], ... codes=[[0, 0, 0, 1, 1, 1, 2, 2, 2], [0, 1, 2, 0, 1, 2, 0, 1, 2]], ... ) >>> df = pd.DataFrame( ... index=midx, ... columns=["big", "small"], ... data=[ ... [45, 30], ... [200, 100], ... [1.5, 1], ... [30, 20], ... [250, 150], ... [1.5, 0.8], ... [320, 250], ... [1, 0.8], ... [0.3, 0.2], ... ], ... ) >>> df big small llama speed 45.0 30.0 weight 200.0 100.0 length 1.5 1.0 cow speed 30.0 20.0 weight 250.0 150.0 length 1.5 0.8 falcon speed 320.0 250.0 weight 1.0 0.8 length 0.3 0.2
从 MultiIndex DataFrame 中删除特定的索引组合,即删除组合
'falcon'
和'weight'
,这将仅删除相应的行。>>> df.drop(index=("falcon", "weight")) big small llama speed 45.0 30.0 weight 200.0 100.0 length 1.5 1.0 cow speed 30.0 20.0 weight 250.0 150.0 length 1.5 0.8 falcon speed 320.0 250.0 length 0.3 0.2
>>> df.drop(index="cow", columns="small") big llama speed 45.0 weight 200.0 length 1.5 falcon speed 320.0 weight 1.0 length 0.3
>>> df.drop(index="length", level=1) big small llama speed 45.0 30.0 weight 200.0 100.0 cow speed 30.0 20.0 weight 250.0 150.0 falcon speed 320.0 250.0 weight 1.0 0.8