Skip to content

ImageNette数据集

ImageNette数据集是较大的ImageNet数据集的一个子集,但它仅包含10个易于区分的类别。它是为了提供一个更快速、更易于使用的ImageNet版本,用于软件开发和教育而创建的。

主要特点

  • ImageNette包含来自10个不同类别的图像,如丁鲷、英国史宾格犬、磁带播放器、链锯、教堂、法国号、垃圾车、加油泵、高尔夫球、降落伞。
  • 该数据集包含不同尺寸的彩色图像。
  • ImageNette广泛用于机器学习领域,特别是在图像分类任务中的训练和测试。

数据集结构

ImageNette数据集分为两个子集:

  1. 训练集:该子集包含数千张用于训练机器学习模型的图像。每个类别的具体数量有所不同。
  2. 验证集:该子集包含数百张用于验证和基准测试训练模型的图像。每个类别的具体数量也有所不同。

应用

ImageNette数据集广泛用于训练和评估图像分类任务中的深度学习模型,如卷积神经网络(CNN),以及其他各种机器学习算法。该数据集的简单格式和精心选择的类别使其成为机器学习和计算机视觉领域初学者和经验丰富的从业者的便捷资源。

使用方法

要在ImageNette数据集上训练一个模型,进行100个epoch,标准图像尺寸为224x224,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# 加载模型
model = YOLO("yolo11n-cls.pt")  # 加载预训练模型(推荐用于训练)

# 训练模型
results = model.train(data="imagenette", epochs=100, imgsz=224)
# 从预训练的*.pt模型开始训练
yolo classify train data=imagenette model=yolo11n-cls.pt epochs=100 imgsz=224

样本图像和注释

ImageNette数据集包含各种物体和场景的彩色图像,为图像分类任务提供了一个多样化的数据集。以下是数据集中的一些图像示例:

数据集样本图像

该示例展示了ImageNette数据集中图像的多样性和复杂性,突出了多样化数据集对于训练鲁棒图像分类模型的重要性。

ImageNette160和ImageNette320

为了更快的原型设计和训练,ImageNette数据集还提供了两个缩小尺寸的版本:ImageNette160和ImageNette320。这些数据集保持了与完整ImageNette数据集相同的类别和结构,但图像被调整为较小的尺寸。因此,这些版本的数

# 从预训练的 *.pt 模型开始训练 ImageNette320
yolo classify train data=imagenette320 model=yolo11n-cls.pt epochs=100 imgsz=320

这些数据集的较小版本允许在开发过程中进行快速迭代,同时仍然提供有价值且真实的图像分类任务。

引用和致谢

如果您在研究或开发工作中使用了 ImageNette 数据集,请适当致谢。有关 ImageNette 数据集的更多信息,请访问 ImageNette 数据集 GitHub 页面

常见问题

什么是 ImageNette 数据集?

ImageNette 数据集 是较大的 ImageNet 数据集 的简化子集,仅包含 10 个易于区分的类别,如丁鲷、英国史宾格犬和法国号。它是为了提供一个更易于管理的数据集,以便高效地训练和评估图像分类模型而创建的。该数据集特别适用于快速软件开发和机器学习及计算机视觉的教育目的。

如何使用 ImageNette 数据集训练 YOLO 模型?

要在 ImageNette 数据集上训练 YOLO 模型 100 个 epoch,您可以使用以下命令。确保已设置 Ultralytics YOLO 环境。

训练示例

from ultralytics import YOLO

# 加载模型
model = YOLO("yolo11n-cls.pt")  # 加载预训练模型(推荐用于训练)

# 训练模型
results = model.train(data="imagenette", epochs=100, imgsz=224)
# 从预训练的 *.pt 模型开始训练
yolo classify train data=imagenette model=yolo11n-cls.pt epochs=100 imgsz=224

更多详情,请参阅 训练 文档页面。

为什么我应该使用 ImageNette 进行图像分类任务?

ImageNette 数据集具有以下几个优势:

  • 快速且简单:它仅包含 10 个类别,相比更大的数据集,复杂度和耗时更少。
  • 教育用途:非常适合学习和教授图像分类的基础知识,因为它需要的计算能力和时间较少。
  • 多功能性:广泛用于训练和基准测试各种机器学习模型,特别是在图像分类领域。

有关模型训练和数据集管理的更多详情,请探索 数据集结构 部分。

ImageNette 数据集可以用于不同图像尺寸吗?

是的,ImageNette 数据集还有两个调整大小的版本:ImageNette160 和 ImageNette320。这些版本有助于更快的原型设计和在计算资源有限时特别有用。

使用 ImageNette160 训练示例

from ultralytics import YOLO

# 加载模型
model = YOLO("yolo11n-cls.pt")

# 使用 ImageNette160 训练模型
results = model.train(data="imagenette160", epochs=100, imgsz=160)
# 从预训练的 *.pt 模型开始训练 ImageNette160
yolo detect train data=imagenette160 model=yolo11n-cls.pt epochs=100 imgsz=160

更多信息,请参阅 使用 ImageNette160 和 ImageNette320 进行训练

ImageNette 数据集有哪些实际应用?

ImageNette 数据集广泛用于:

  • 教育环境:用于教育机器学习和 计算机视觉 的初学者。
  • 软件开发:用于图像分类模型的快速原型设计和开发。
  • 深度学习研究:用于评估和基准测试各种深度学习模型,特别是卷积 神经网络 (CNN)。

探索 应用 部分以获取详细用例。


📅 Created 11 months ago ✏️ Updated 13 days ago

Comments