dask_ml.datasets.make_counts

dask_ml.datasets.make_counts

dask_ml.datasets.make_counts(n_samples=1000, n_features=100, n_informative=2, scale=1.0, chunks=100, random_state=None)[源代码]

生成一个用于建模计数数据的虚拟数据集。

参数
n_samples整数

输出数组中的行数

n_features整数

输出数组中的列数(特征)

n_informative整数

与结果相关的特征数量

比例浮动

按此比例缩放真实系数数组

整数

每个dask数组块的行数。

random_stateint, RandomState 实例或 None (默认)

确定数据集创建的随机数生成。传递一个整数以在多次函数调用中获得可重现的输出。参见 术语表

返回
X : dask.array, 大小 (n_samples, n_features)dask.array, 大小
y : dask.array, 大小 (n_samples,)dask.array, 大小

非负整数值数据的数组

示例

>>> X, y = make_counts()