SingleSplit#

class SingleSplit(test_size=0.25, train_size=None, random_state=None, shuffle=True, stratify=None)[源代码][源代码]#

用于编排的辅助类,使用单一分割进行训练和测试。

sklearn.model_selection.train_test_split 的包装器

参数:
*数组具有相同长度/形状[0]的可索引序列

允许的输入包括列表、numpy 数组、scipy-sparse 矩阵或 pandas 数据框。

测试规模float, int 或 None, 可选 (默认=0.25)

如果是浮点数,应在0.0到1.0之间,表示测试分割中包含的数据集比例。如果是整数,表示测试样本的绝对数量。如果是None,该值设置为训练大小的补数。默认情况下,该值设置为0.25。默认值将在版本0.21中更改。只有在未指定``train_size``时,它才会保持为0.25,否则它将补充指定的``train_size``。

train_sizefloat, int, 或 None, (默认=None)

如果是浮点数,应在0.0到1.0之间,表示训练分割中包含的数据集比例。如果是整数,表示训练样本的绝对数量。如果是None,该值会自动设置为测试大小的补数。

random_stateint, RandomState 实例或 None, 可选 (默认=None)

如果为整数,random_state 是随机数生成器使用的种子;如果为 RandomState 实例,random_state 是随机数生成器;如果为 None,随机数生成器是 np.random 使用的 RandomState 实例。

洗牌布尔值,可选(默认=True)

在分割数据之前是否对数据进行洗牌。如果 shuffle=False,则 stratify 必须为 None。

分层类似数组或 None (默认=None)

如果不是 None,数据将按分层方式分割,使用此作为类别标签。

方法

get_n_splits()

返回分割的次数(1)。

split(data[, y, groups])

将数据分为训练数据和测试数据。

split(data, y=None, groups=None)[源代码][源代码]#

将数据分为训练数据和测试数据。

参数:
数据pandas 数据框

用于交叉验证的数据

返回:
元组

(训练, 测试) 索引

static get_n_splits()[源代码][源代码]#

返回分割的次数(1)。