dask_ml.model_selection.KFold

dask_ml.model_selection.KFold

class dask_ml.model_selection.KFold(n_splits=5, shuffle=False, random_state=None)[源代码]

K折交叉验证器

提供训练/测试索引以将数据分割为训练/测试集。将数据集分割为k个连续的折叠(默认不进行洗牌)。

每个折叠随后被用作一次验证,而剩余的 k - 1 个折叠则构成训练集。

参数
n_splitsint, 默认=5

折叠次数。必须至少为2。

洗牌布尔值,可选

在将数据分割成批次之前是否对其进行洗牌。

random_stateint, RandomState 实例或 None, 可选, 默认=None

如果为整数,random_state 是随机数生成器使用的种子;如果为 RandomState 实例,random_state 是随机数生成器;如果为 None,随机数生成器是 np.random 使用的 RandomState 实例。当 shuffle == True 时使用。

方法

get_metadata_routing()

获取此对象的元数据路由。

get_n_splits([X, y, groups])

返回交叉验证器中的分割迭代次数。

split(X[, y, groups])

生成索引以将数据分割为训练集和测试集。

__init__(n_splits=5, shuffle=False, random_state=None)[源代码]