dask_ml.datasets.make_counts
dask_ml.datasets.make_counts¶
- dask_ml.datasets.make_counts(n_samples=1000, n_features=100, n_informative=2, scale=1.0, chunks=100, random_state=None)[源代码]¶
生成一个用于建模计数数据的虚拟数据集。
- 参数
- n_samples整数
输出数组中的行数
- n_features整数
输出数组中的列数(特征)
- n_informative整数
与结果相关的特征数量
- 比例浮动
按此比例缩放真实系数数组
- 块整数
每个dask数组块的行数。
- random_stateint, RandomState 实例或 None (默认)
确定数据集创建的随机数生成。传递一个整数以在多次函数调用中获得可重现的输出。参见 术语表。
- 返回
- X : dask.array, 大小
(n_samples, n_features)
dask.array, 大小 - y : dask.array, 大小
(n_samples,)
dask.array, 大小 非负整数值数据的数组
- X : dask.array, 大小
示例
>>> X, y = make_counts()