dask.dataframe.DataFrame.lt

dask.dataframe.DataFrame.lt

DataFrame.lt(other, axis='columns', level=None)

获取数据框和其他对象的元素级小于比较(二元运算符 lt)。

此文档字符串是从 pandas.core.frame.DataFrame.lt 复制而来的。

Dask 版本可能存在一些不一致性。

在灵活的包装器中 (eq, ne, le, lt, ge, gt) 用于比较运算符。

等同于 ==, !=, <=, <, >=, >,支持选择轴(行或列)和比较级别。

参数
其他标量、序列、Series 或 DataFrame

任何单个或多个元素的数据结构,或类似列表的对象。

{0 或 ‘index’, 1 或 ‘columns’}, 默认 ‘columns’

是否按索引(0 或 ‘index’)或列(1 或 ‘columns’)进行比较。

级别int 或 label

在某一级别上进行广播,匹配传递的 MultiIndex 级别的索引值。

返回
布尔类型的DataFrame

比较结果。

参见

DataFrame.eq

逐元素比较DataFrame的相等性。

DataFrame.ne

逐元素比较 DataFrame 的不等性。

DataFrame.le

逐元素比较DataFrame是否小于或等于。

DataFrame.lt

逐元素比较DataFrame,判断是否严格小于。

DataFrame.ge

逐元素比较DataFrame是否大于或等于。

DataFrame.gt

逐元素比较DataFrame,检查是否严格大于不等式。

注释

不匹配的索引将被联合在一起。NaN 值被视为不同(即 NaN != NaN)。

示例

>>> df = pd.DataFrame({'cost': [250, 150, 100],  
...                    'revenue': [100, 250, 300]},
...                   index=['A', 'B', 'C'])
>>> df  
   cost  revenue
A   250      100
B   150      250
C   100      300

与标量进行比较,使用运算符或方法:

>>> df == 100  
    cost  revenue
A  False     True
B  False    False
C   True    False
>>> df.eq(100)  
    cost  revenue
A  False     True
B  False    False
C   True    False

other 是一个 Series 时,DataFrame 的列将与 other 的索引对齐并广播:

>>> df != pd.Series([100, 250], index=["cost", "revenue"])  
    cost  revenue
A   True     True
B   True    False
C  False     True

使用该方法来控制广播轴:

>>> df.ne(pd.Series([100, 300], index=["A", "D"]), axis='index')  
   cost  revenue
A  True    False
B  True     True
C  True     True
D  True     True

当与任意序列比较时,列数必须与 other 中的元素数量匹配:

>>> df == [250, 100]  
    cost  revenue
A   True     True
B  False    False
C  False    False

使用该方法来控制轴:

>>> df.eq([250, 250, 100], axis='index')  
    cost  revenue
A   True    False
B  False     True
C   True    False

与不同形状的 DataFrame 进行比较。

>>> other = pd.DataFrame({'revenue': [300, 250, 100, 150]},  
...                      index=['A', 'B', 'C', 'D'])
>>> other  
   revenue
A      300
B      250
C      100
D      150
>>> df.gt(other)  
    cost  revenue
A  False    False
B  False    False
C  False     True
D  False    False

按级别与 MultiIndex 进行比较。

>>> df_multindex = pd.DataFrame({'cost': [250, 150, 100, 150, 300, 220],  
...                              'revenue': [100, 250, 300, 200, 175, 225]},
...                             index=[['Q1', 'Q1', 'Q1', 'Q2', 'Q2', 'Q2'],
...                                    ['A', 'B', 'C', 'A', 'B', 'C']])
>>> df_multindex  
      cost  revenue
Q1 A   250      100
   B   150      250
   C   100      300
Q2 A   150      200
   B   300      175
   C   220      225
>>> df.le(df_multindex, level=1)  
       cost  revenue
Q1 A   True     True
   B   True     True
   C   True     True
Q2 A  False     True
   B   True    False
   C   True    False