Skip to content

全球小麦穗数据集

全球小麦穗数据集 是一个图像集合,旨在支持开发用于小麦表型分析和作物管理应用的精确小麦穗检测模型。小麦穗,也称为穗,是小麦植物的谷物部分。准确估计小麦穗的密度和大小对于评估作物健康、成熟度和产量潜力至关重要。该数据集由来自七个国家的九个研究机构合作创建,涵盖多个种植区域,以确保模型在不同环境中具有良好的泛化能力。

关键特点

  • 该数据集包含来自欧洲(法国、英国、瑞士)和北美(加拿大)的超过3,000张训练图像。
  • 它包括来自澳大利亚、日本和中国的约1,000张测试图像。
  • 图像为户外田间图像,捕捉了小麦穗外观的自然变异性。
  • 注释包括小麦穗的边界框,以支持目标检测任务。

数据集结构

全球小麦穗数据集分为两个主要子集:

  1. 训练集:该子集包含来自欧洲和北美的超过3,000张图像。这些图像带有小麦穗的边界框标签,为训练目标检测模型提供了真实数据。
  2. 测试集:该子集包含来自澳大利亚、日本和中国的约1,000张图像。这些图像用于评估训练模型在未见过的基因型、环境和观察条件下的性能。

应用

全球小麦穗数据集广泛用于训练和评估深度学习模型在小麦穗检测任务中的应用。该数据集的多样化图像,捕捉了广泛的外观、环境和条件,使其成为植物表型分析和作物管理领域研究人员和从业者的宝贵资源。

数据集 YAML

使用YAML(Yet Another Markup Language)文件定义数据集配置。它包含有关数据集路径、类别和其他相关信息。对于全球小麦穗数据集,GlobalWheat2020.yaml文件保存在https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/GlobalWheat2020.yaml

ultralytics/cfg/datasets/GlobalWheat2020.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Global Wheat 2020 dataset https://www.global-wheat.com/ by University of Saskatchewan
# Documentation: https://docs.ultralytics.com/datasets/detect/globalwheat2020/
# Example usage: yolo train data=GlobalWheat2020.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── GlobalWheat2020  ← downloads here (7.0 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/GlobalWheat2020 # dataset root dir
train: # train images (relative to 'path') 3422 images
  - images/arvalis_1
  - images/arvalis_2
  - images/arvalis_3
  - images/ethz_1
  - images/rres_1
  - images/inrae_1
  - images/usask_1
val: # val images (relative to 'path') 748 images (WARNING: train set contains ethz_1)
  - images/ethz_1
test: # test images (optional) 1276 images
  - images/utokyo_1
  - images/utokyo_2
  - images/nau_1
  - images/uq_1

# Classes
names:
  0: wheat_head

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download
  dir = Path(yaml['path'])  # dataset root dir
  urls = ['https://zenodo.org/record/4298502/files/global-wheat-codalab-official.zip',
          'https://github.com/ultralytics/assets/releases/download/v0.0.0/GlobalWheat2020_labels.zip']
  download(urls, dir=dir)

  # Make Directories
  for p in 'annotations', 'images', 'labels':
      (dir / p).mkdir(parents=True, exist_ok=True)

  # Move
  for p in 'arvalis_1', 'arvalis_2', 'arvalis_3', 'ethz_1', 'rres_1', 'inrae_1', 'usask_1', \
           'utokyo_1', 'utokyo_2', 'nau_1', 'uq_1':
      (dir / 'global-wheat-codalab-official' / p).rename(dir / 'images' / p)  # move to /images
      f = (dir / 'global-wheat-codalab-official' / p).with_suffix('.json')  # json file
      if f.exists():
          f.rename((dir / 'annotations' / p).with_suffix('.json'))  # move to /annotations

使用方法

要在全球小麦穗数据集上训练YOLO11n模型100个epoch,图像大小为640,您可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# 加载模型
model = YOLO("yolo11n.pt")  # 加载预训练模型(推荐用于训练)

# 训练模型
results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640)
# 从预训练的*.pt模型开始训练
yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640

样本数据和注释

全球小麦穗数据集包含多样化的户外田间图像,捕捉了小麦穗外观、环境和条件的自然变异性。以下是数据集中的一些示例数据及其相应的注释:

数据集样本图像

  • 小麦穗检测:此图像展示了一个小麦穗检测的示例,其中小麦穗用边界框标注。该数据集提供了多种图像,以促进此任务的模型开发。

该示例展示了全球小麦穗数据集中数据的多样性和复杂性,并强调了准确的小麦穗检测在小麦表型分析和作物管理应用中的重要性。

引用和致谢

如果您在研究或开发工作中使用了全球小麦穗数据集,请引用以下论文:

```bibtex @article{david2020global,

@article{david2020global, title={Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods}, author={David, Etienne and Madec, Simon and Sadeghi-Tehran, Pouria and Aasen, Helge and Zheng, Bangyou and Liu, Shouyang and Kirchgessner, Norbert and Ishikawa, Goro and Nagasawa, Koichi and Badhon, Minhajul and others}, journal={arXiv preprint arXiv:2005.02162}, year={2020} }

我们希望向参与创建和维护全球小麦穗数据集的研究人员和机构表示感谢,该数据集已成为植物表型和作物管理研究社区的宝贵资源。有关数据集及其创建者的更多信息,请访问全球小麦穗数据集网站

常见问题

全球小麦穗数据集的用途是什么?

全球小麦穗数据集主要用于开发和训练旨在检测小麦穗的深度学习模型。这对于小麦表型和作物管理应用至关重要,能够更准确地估计小麦穗密度、大小和整体作物产量潜力。准确的检测方法有助于评估作物健康和成熟度,这对高效的作物管理至关重要。

如何在全球小麦穗数据集上训练YOLO11n模型?

要在全球小麦穗数据集上训练YOLO11n模型,您可以使用以下代码片段。确保您有指定数据集路径和类别的GlobalWheat2020.yaml配置文件:

训练示例

```python from ultralytics import YOLO

加载预训练模型(推荐用于训练)

model = YOLO("yolo11n.pt")

训练模型

results = model.train(data="GlobalWheat2020.yaml", epochs=100, imgsz=640) ```

```bash

从预训练的 *.pt 模型开始训练

yolo detect train data=GlobalWheat2020.yaml model=yolo11n.pt epochs=100 imgsz=640 ```

有关可用参数的完整列表,请参阅模型训练页面。

全球小麦穗数据集的关键特征是什么?

全球小麦穗数据集的关键特征包括:

  • 来自欧洲(法国、英国、瑞士)和北美(加拿大)的超过3,000张训练图像。
  • 来自澳大利亚、日本和中国的约1,000张测试图像。
  • 由于不同生长环境导致的小麦穗外观的高度变异性。
  • 带有小麦穗边界框的详细标注,以帮助目标检测模型。

这些特征有助于开发能够在多个地区泛化的稳健模型。

我在哪里可以找到全球小麦穗数据集的配置YAML文件?

全球小麦穗数据集的配置YAML文件名为GlobalWheat2020.yaml,可在GitHub上找到。您可以通过此链接访问它。该文件包含数据集路径、类别和其他在Ultralytics YOLO中进行模型训练所需的配置细节。

为什么小麦穗检测在作物管理中很重要?

小麦穗检测在作物管理中至关重要,因为它能够准确估计小麦穗密度和大小,这对于评估作物健康、成熟度和产量潜力至关重要。通过利用在类似全球小麦穗数据集上训练的深度学习模型,农民和研究人员可以更好地监控和管理作物,从而提高生产力和优化农业实践中的资源利用。这一技术进步支持可持续农业和粮食安全倡议。

有关人工智能在农业中的应用的更多信息,请访问人工智能在农业


📅 Created 11 months ago ✏️ Updated 13 days ago

Comments