Skip to content

Ultralytics HUB 数据集

Ultralytics HUB 数据集是管理和利用您的自定义数据集的实用解决方案。

上传后,数据集可以立即用于模型训练。这种集成方法促进了从数据集管理到模型训练的无缝过渡,显著简化了整个过程。


观看: 观看: 上传数据集到Ultralytics HUB | 数据集上传功能的完整指南

上传数据集

Ultralytics HUB 数据集就像 YOLOv5 和 YOLOv8 🚀 数据集一样。它们使用相同的结构和相同的标签格式,以保持一切简单。

在将数据集上传到 Ultralytics HUB 之前,请确保 将您的数据集 YAML 文件放置在数据集根目录中,并且 您的数据集 YAML、目录和 ZIP 文件具有相同的名称,如下例所示,然后将数据集目录压缩。

例如,如果您的数据集名为“coco8”,就像我们的 COCO8 示例数据集一样,那么您应该在 coco8/ 目录中有一个 coco8.yaml,这将创建一个 coco8.zip 当压缩时:

zip -r coco8.zip coco8

您可以下载我们的 COCO8 示例数据集并解压缩,以确切了解如何构建您的数据集。

COCO8 数据集结构

数据集 YAML 是标准的 YOLOv5 和 YOLOv8 YAML 格式。

coco8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

压缩数据集后,您应在将其上传到 Ultralytics HUB 之前 验证它Ultralytics HUB 在数据集上传后进行验证检查,因此通过确保您的数据集格式正确且无错误,您可以防止因数据集被拒绝而导致的任何延误。

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

一旦您的数据集 ZIP 准备就绪,通过点击侧边栏中的 数据集 按钮导航到 数据集 页面,然后点击页面右上角的 上传数据集 按钮。

Ultralytics HUB 数据集页面截图,箭头指向侧边栏中的数据集按钮和上传数据集按钮

Tip

您可以直接从 主页 页面上传数据集。

Ultralytics HUB 主页截图,箭头指向上传数据集卡片

此操作将触发 上传数据集 对话框。

选择您的数据集任务,并在 数据集 .zip 文件 字段中上传它。

您还可以为您的 Ultralytics HUB 数据集设置自定义名称和描述。

当您对数据集配置满意时,点击 上传

Ultralytics HUB 上传数据集对话框截图,箭头指向数据集任务、数据集文件和上传按钮

数据集上传和处理完成后,您可以从 数据集 页面访问它。

Ultralytics HUB 数据集页面截图,箭头指向其中一个数据集

您可以按拆分(训练、验证、测试)查看数据集中的图像。

Ultralytics HUB 数据集页面截图,箭头指向图像标签

Tip

每张图片都可以放大以获得更好的可视化效果。

Ultralytics HUB 截图,显示数据集页面内的图像标签,箭头指向展开图标

Ultralytics HUB 截图,显示数据集页面内的图像标签,其中一张图像已展开

此外,您可以通过点击 概览 标签来分析您的数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向概览标签

接下来,在您的数据集上训练模型

Ultralytics HUB 截图,显示数据集页面,箭头指向训练模型按钮

下载数据集

导航到您想要下载的数据集的数据集页面,打开数据集操作下拉菜单并点击 下载 选项。此操作将开始下载您的数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向下载选项

Tip

您可以直接从数据集页面下载数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集的下载选项

分享数据集

Info

Ultralytics HUB 的分享功能提供了一种便捷的方式与其他人分享数据集。此功能旨在适应现有的 Ultralytics HUB 用户以及尚未创建账户的用户。

Note

您可以控制数据集的通用访问权限。

您可以选择将通用访问权限设置为“私有”,在这种情况下,只有您可以访问它。或者,您可以将通用访问权限设置为“未列出”,这将允许任何拥有数据集直接链接的人查看数据集,无论他们是否有 Ultralytics HUB 账户。

导航到您想要分享的数据集的数据集页面,打开数据集操作下拉菜单并点击 分享 选项。此操作将触发 分享数据集 对话框。

Ultralytics HUB 截图,显示数据集页面,箭头指向分享选项

Tip

您可以直接从数据集页面分享数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集的分享选项

将通用访问权限设置为“未列出”并点击 保存

Ultralytics HUB 截图,显示分享数据集对话框,箭头指向下拉菜单和保存按钮

现在,任何拥有数据集直接链接的人都可以查看它。

Tip

您可以轻松点击 分享数据集 对话框中显示的数据集链接来复制它。

Ultralytics HUB 截图,显示分享数据集对话框,箭头指向数据集链接

编辑数据集

导航到您想要编辑的数据集的数据集页面,打开数据集操作下拉菜单并点击 编辑 选项。此操作将触发 更新数据集 对话框。

Ultralytics HUB 截图,显示数据集页面,箭头指向编辑选项

Tip

您可以直接从数据集页面编辑数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集的编辑选项

对您的数据集应用所需的修改,然后通过点击 保存 确认更改。

Ultralytics HUB 截图,显示更新数据集对话框,箭头指向保存按钮

删除数据集

导航到您想要删除的数据集的数据集页面,打开数据集操作下拉菜单并点击 删除 选项。此操作将删除数据集。 Ultralytics HUB 数据集页面截图,箭头指向删除选项

Tip

您可以直接从数据集页面删除数据集。

Ultralytics HUB 数据集页面截图,箭头指向其中一个数据集的删除选项

Note

如果您改变主意,可以从回收站页面恢复数据集。

Ultralytics HUB 回收站页面截图,箭头指向侧边栏中的回收站按钮和其中一个数据集的恢复选项


📅 Created 11 months ago ✏️ Updated 11 days ago

Comments