shap.datasets.iris

shap.datasets.iris(display=False, n_points=None)[源代码]

返回经典的鸢尾花数据集在一个方便的包中。

参数:
显示布尔

如果为 True,返回原始特征矩阵以及类标签(以字符串形式)。默认为 False。

- n_pointsint, 可选

要包含的数据点数量。默认值为 None,即包含所有数据点。

返回:
包含特征矩阵的 pandas DataFrame 元组,以及表示类别标签的 numpy 数组或类别标签列表(如果 display 为 True)。

注释

  • 该数据集包括三种鸢尾花的花萼长度、花萼宽度、花瓣长度和花瓣宽度的测量值。

  • 类别标签被编码为整数(0, 1, 2),分别代表物种(setosa, versicolor, virginica)。

  • 如果 display 为 True,类标签将作为字符串返回。

示例

要获取特征矩阵和类别标签:

features, labels = shap.datasets.iris()

要获取特征矩阵和类标签作为字符串:

features, class_labels = shap.datasets.iris(display=True)