shap.datasets.iris
- shap.datasets.iris(display=False, n_points=None)[源代码]
返回经典的鸢尾花数据集在一个方便的包中。
- 参数:
- 显示布尔
如果为 True,返回原始特征矩阵以及类标签(以字符串形式)。默认为 False。
- - n_pointsint, 可选
要包含的数据点数量。默认值为 None,即包含所有数据点。
- 返回:
- 包含特征矩阵的 pandas DataFrame 元组,以及表示类别标签的 numpy 数组或类别标签列表(如果 display 为 True)。
注释
该数据集包括三种鸢尾花的花萼长度、花萼宽度、花瓣长度和花瓣宽度的测量值。
类别标签被编码为整数(0, 1, 2),分别代表物种(setosa, versicolor, virginica)。
如果 display 为 True,类标签将作为字符串返回。
示例
要获取特征矩阵和类别标签:
features, labels = shap.datasets.iris()
要获取特征矩阵和类标签作为字符串:
features, class_labels = shap.datasets.iris(display=True)