dask.dataframe.DataFrame.ne
dask.dataframe.DataFrame.ne¶
- DataFrame.ne(other, axis='columns', level=None)¶
获取数据框和另一个数据框的元素不等式(二元运算符 ne)。
此文档字符串是从 pandas.core.frame.DataFrame.ne 复制而来的。
Dask 版本可能存在一些不一致性。
在灵活的包装器中 (eq, ne, le, lt, ge, gt) 用于比较运算符。
等同于 ==, !=, <=, <, >=, >,支持选择轴(行或列)和比较级别。
- 参数
- 其他标量、序列、Series 或 DataFrame
任何单个或多个元素的数据结构,或类似列表的对象。
- 轴{0 或 ‘index’, 1 或 ‘columns’}, 默认 ‘columns’
是否按索引(0 或 ‘index’)或列(1 或 ‘columns’)进行比较。
- 级别int 或 label
在某一级别上进行广播,匹配传递的 MultiIndex 级别的索引值。
- 返回
- 布尔类型的DataFrame
比较结果。
参见
DataFrame.eq
逐元素比较DataFrame的相等性。
DataFrame.ne
逐元素比较 DataFrame 的不等性。
DataFrame.le
逐元素比较DataFrame是否小于或等于。
DataFrame.lt
逐元素比较DataFrame,判断是否严格小于。
DataFrame.ge
逐元素比较DataFrame是否大于或等于。
DataFrame.gt
逐元素比较DataFrame,检查是否严格大于不等式。
注释
不匹配的索引将被联合在一起。NaN 值被视为不同(即 NaN != NaN)。
示例
>>> df = pd.DataFrame({'cost': [250, 150, 100], ... 'revenue': [100, 250, 300]}, ... index=['A', 'B', 'C']) >>> df cost revenue A 250 100 B 150 250 C 100 300
与标量进行比较,使用运算符或方法:
>>> df == 100 cost revenue A False True B False False C True False
>>> df.eq(100) cost revenue A False True B False False C True False
当 other 是一个
Series
时,DataFrame 的列将与 other 的索引对齐并广播:>>> df != pd.Series([100, 250], index=["cost", "revenue"]) cost revenue A True True B True False C False True
使用该方法来控制广播轴:
>>> df.ne(pd.Series([100, 300], index=["A", "D"]), axis='index') cost revenue A True False B True True C True True D True True
当与任意序列比较时,列数必须与 other 中的元素数量匹配:
>>> df == [250, 100] cost revenue A True True B False False C False False
使用该方法来控制轴:
>>> df.eq([250, 250, 100], axis='index') cost revenue A True False B False True C True False
与不同形状的 DataFrame 进行比较。
>>> other = pd.DataFrame({'revenue': [300, 250, 100, 150]}, ... index=['A', 'B', 'C', 'D']) >>> other revenue A 300 B 250 C 100 D 150
>>> df.gt(other) cost revenue A False False B False False C False True D False False
按级别与 MultiIndex 进行比较。
>>> df_multindex = pd.DataFrame({'cost': [250, 150, 100, 150, 300, 220], ... 'revenue': [100, 250, 300, 200, 175, 225]}, ... index=[['Q1', 'Q1', 'Q1', 'Q2', 'Q2', 'Q2'], ... ['A', 'B', 'C', 'A', 'B', 'C']]) >>> df_multindex cost revenue Q1 A 250 100 B 150 250 C 100 300 Q2 A 150 200 B 300 175 C 220 225
>>> df.le(df_multindex, level=1) cost revenue Q1 A True True B True True C True True Q2 A False True B True False C True False