Ultralytics HUB 数据集
Ultralytics HUB 数据集是管理和利用您的自定义数据集的实用解决方案。
上传后,数据集可以立即用于模型训练。这种集成方法促进了从数据集管理到模型训练的无缝过渡,显著简化了整个过程。
观看: 观看: 上传数据集到Ultralytics HUB | 数据集上传功能的完整指南
上传数据集
Ultralytics HUB 数据集就像 YOLOv5 和 YOLOv8 🚀 数据集一样。它们使用相同的结构和相同的标签格式,以保持一切简单。
在将数据集上传到 Ultralytics HUB 之前,请确保 将您的数据集 YAML 文件放置在数据集根目录中,并且 您的数据集 YAML、目录和 ZIP 文件具有相同的名称,如下例所示,然后将数据集目录压缩。
例如,如果您的数据集名为“coco8”,就像我们的 COCO8 示例数据集一样,那么您应该在 coco8/
目录中有一个 coco8.yaml
,这将创建一个 coco8.zip
当压缩时:
您可以下载我们的 COCO8 示例数据集并解压缩,以确切了解如何构建您的数据集。
数据集 YAML 是标准的 YOLOv5 和 YOLOv8 YAML 格式。
coco8.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
压缩数据集后,您应在将其上传到 Ultralytics HUB 之前 验证它。Ultralytics HUB 在数据集上传后进行验证检查,因此通过确保您的数据集格式正确且无错误,您可以防止因数据集被拒绝而导致的任何延误。
一旦您的数据集 ZIP 准备就绪,通过点击侧边栏中的 数据集 按钮导航到 数据集 页面,然后点击页面右上角的 上传数据集 按钮。
此操作将触发 上传数据集 对话框。
选择您的数据集任务,并在 数据集 .zip 文件 字段中上传它。
您还可以为您的 Ultralytics HUB 数据集设置自定义名称和描述。
当您对数据集配置满意时,点击 上传。
数据集上传和处理完成后,您可以从 数据集 页面访问它。
您可以按拆分(训练、验证、测试)查看数据集中的图像。
Tip
每张图片都可以放大以获得更好的可视化效果。
此外,您可以通过点击 概览 标签来分析您的数据集。
接下来,在您的数据集上训练模型。
下载数据集
导航到您想要下载的数据集的数据集页面,打开数据集操作下拉菜单并点击 下载 选项。此操作将开始下载您的数据集。
分享数据集
Info
Ultralytics HUB 的分享功能提供了一种便捷的方式与其他人分享数据集。此功能旨在适应现有的 Ultralytics HUB 用户以及尚未创建账户的用户。
Note
您可以控制数据集的通用访问权限。
您可以选择将通用访问权限设置为“私有”,在这种情况下,只有您可以访问它。或者,您可以将通用访问权限设置为“未列出”,这将允许任何拥有数据集直接链接的人查看数据集,无论他们是否有 Ultralytics HUB 账户。
导航到您想要分享的数据集的数据集页面,打开数据集操作下拉菜单并点击 分享 选项。此操作将触发 分享数据集 对话框。
将通用访问权限设置为“未列出”并点击 保存。
现在,任何拥有数据集直接链接的人都可以查看它。
Tip
您可以轻松点击 分享数据集 对话框中显示的数据集链接来复制它。
编辑数据集
导航到您想要编辑的数据集的数据集页面,打开数据集操作下拉菜单并点击 编辑 选项。此操作将触发 更新数据集 对话框。
对您的数据集应用所需的修改,然后通过点击 保存 确认更改。
删除数据集
导航到您想要删除的数据集的数据集页面,打开数据集操作下拉菜单并点击 删除 选项。此操作将删除数据集。