find_numerical_variables#

find_numerical_variables() 返回一个包含数据集中数值变量名称的列表。

让我们创建一个包含数值、分类和日期时间变量的玩具数据集:

import pandas as pd
df = pd.DataFrame({
    "Name": ["tom", "nick", "krish", "jack"],
    "City": ["London", "Manchester", "Liverpool", "Bristol"],
    "Age": [20, 21, 19, 18],
    "Marks": [0.9, 0.8, 0.7, 0.6],
    "dob": pd.date_range("2020-02-24", periods=4, freq="T"),
})

print(df.head())

我们在下面看到生成的数据框:

    Name        City  Age  Marks                 dob
0    tom      London   20    0.9 2020-02-24 00:00:00
1   nick  Manchester   21    0.8 2020-02-24 00:01:00
2  krish   Liverpool   19    0.7 2020-02-24 00:02:00
3   jack     Bristol   18    0.6 2020-02-24 00:03:00

使用 find_numerical_variables() 我们可以捕获列表中所有数值变量的名称。因此,让我们这样做,然后显示列表:

from feature_engine.variable_handling import find_numerical_variables

var_num = find_numerical_variables(df)

var_num

我们在下面的列表中看到数值变量的名称:

['Age', 'Marks']

如果数据集中没有数值变量,find_numerical_variables() 将引发错误。