shap.datasets.imagenet50

shap.datasets.imagenet50(resolution=224, n_points=None)[源代码]

返回一组代表 ImageNet 图像的 50 张图片。

参数:
分辨率整数

图像的分辨率。目前唯一支持的值是 224。

n_pointsint, 可选

要采样的数据点数量。如果为 None,则使用整个数据集。

返回:
表示图像的 numpy 数组元组和表示标签的 numpy 数组。

注释

此数据集是通过随机找到一个有效的 ImageNet 链接,然后将原始 ImageNet 图像粘贴到限制为可重复使用的图像的 Google 图片搜索中收集的。下载了一个类似的图像(现在具有重复使用的权利)作为原始 ImageNet 图像的粗略替代品。目的是拥有一个 ImageNet 的随机样本,作为解释在 ImageNet 数据上训练的模型的背景分布。

请注意,由于这些图像只是粗略的替代品,标签可能不再正确。

示例

要获取处理后的图像和标签:

images, labels = shap.datasets.imagenet50()