make_moons#
- sklearn.datasets.make_moons(n_samples=100, *, shuffle=True, noise=None, random_state=None)#
制作两个交错的半圆。
一个简单的玩具数据集,用于可视化聚类和分类算法。更多信息请参阅 用户指南 。
- Parameters:
- n_samplesint 或形状为 (2,) 的元组, dtype=int, 默认=100
如果是 int,则生成的总点数。 如果是两元素元组,则每个半圆中的点数。
Changed in version 0.23: 添加了两元素元组。
- shufflebool, 默认=True
是否打乱样本。
- noisefloat, 默认=None
添加到数据中的高斯噪声的标准差。
- random_stateint, RandomState 实例或 None, 默认=None
确定用于数据集洗牌和噪声的随机数生成。 传递一个 int 以在多次函数调用中获得可重复的输出。 请参阅 术语表 。
- Returns:
- X形状为 (n_samples, 2) 的 ndarray
生成的样本。
- y形状为 (n_samples,) 的 ndarray
每个样本的整数标签(0 或 1),表示类成员身份。
Examples
>>> from sklearn.datasets import make_moons >>> X, y = make_moons(n_samples=200, noise=0.2, random_state=42) >>> X.shape (200, 2) >>> y.shape (200,)
Gallery examples#
分类器比较
在玩具数据集上比较不同的聚类算法
对比不同层次聚类方法在玩具数据集上的表现
比较用于异常检测的算法在玩具数据集上的表现
使用网格搜索进行模型的统计比较
多层感知器中的正则化变化
对比MLPClassifier的随机学习策略
特征离散化