make_circles#
- sklearn.datasets.make_circles(n_samples=100, *, shuffle=True, noise=None, random_state=None, factor=0.8)#
创建一个包含较小圆的大圆在二维平面上。
一个简单的玩具数据集,用于可视化聚类和分类算法。
更多信息请参阅 用户指南 。
- Parameters:
- n_samplesint 或形状为 (2,) 的元组, dtype=int, 默认=100
如果是 int,则是生成的总点数。 对于奇数,内圆将比外圆多一个点。 如果是两元素元组,则为外圆和内圆的点数。
Changed in version 0.23: 添加了两元素元组。
- shufflebool, 默认=True
是否打乱样本。
- noisefloat, 默认=None
添加到数据中的高斯噪声的标准差。
- random_stateint, RandomState 实例或 None, 默认=None
确定用于数据集洗牌和噪声的随机数生成。 传递一个 int 以在多次函数调用中获得可重复的输出。 请参阅 术语 。
- factorfloat, 默认=.8
内圆和外圆之间的比例因子,范围在
[0, 1)
之间。
- Returns:
- X形状为 (n_samples, 2) 的 ndarray
生成的样本。
- y形状为 (n_samples,) 的 ndarray
每个样本的整数标签(0 或 1),表示类成员身份。
Examples
>>> from sklearn.datasets import make_circles >>> X, y = make_circles(random_state=42) >>> X.shape (100, 2) >>> y.shape (100,) >>> list(y[:5]) [1, 1, 1, 0, 0]
Gallery examples#
分类器比较
在玩具数据集上比较不同的聚类算法
对比不同层次聚类方法在玩具数据集上的表现
核主成分分析
使用完全随机树的哈希特征变换
t-SNE:不同困惑度值对形状的影响
多层感知器中的正则化变化
对比MLPClassifier的随机学习策略
特征离散化
标签传播学习复杂结构