Passer au contenu

Ensembles de données Ultralytics HUB

Les ensembles de données Ultralytics HUB sont une solution pratique pour gérer et exploiter vos ensembles de données personnalisés.

Une fois téléchargés, les ensembles de données peuvent être immédiatement utilisés pour l'entraînement du modèle. Cette approche intégrée facilite une transition transparente de la gestion des ensembles de données à l'entraînement du modèle, simplifiant considérablement l'ensemble du processus.


Regarder : Télécharger des ensembles de données vers Ultralytics HUB | Procédure complète de la fonctionnalité de téléchargement d'ensembles de données

Télécharger l'ensemble de données

Les ensembles de données Ultralytics HUB sont comme les ensembles de données YOLOv5 et YOLOv8 🚀. Ils utilisent la même structure et les mêmes formats d'étiquettes pour que tout reste simple.

Avant de télécharger un ensemble de données sur Ultralytics HUB, assurez-vous de placer votre fichier YAML d'ensemble de données dans le répertoire racine de l'ensemble de données et que votre fichier YAML d'ensemble de données, votre répertoire et votre ZIP ont le même nom, comme indiqué dans l'exemple ci-dessous, puis compressez le répertoire de l'ensemble de données.

Par exemple, si votre ensemble de données est appelé « coco8 », comme le nôtre COCO8 exemple de jeu de données, vous devriez avoir un coco8.yaml à l'intérieur de votre coco8/ répertoire, ce qui créera un coco8.zip lorsqu'il est compressé :

zip -r coco8.zip coco8

Vous pouvez télécharger notre exemple d'ensemble de données COCO8 et le décompresser pour voir exactement comment structurer votre ensemble de données.

Structure de l'ensemble de données COCO8

Le fichier YAML de l'ensemble de données est le même format YAML standard YOLOv5 et YOLOv8.

coco8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

Après avoir compressé votre ensemble de données, vous devez le valider avant de le télécharger sur Ultralytics HUB. Ultralytics HUB effectue la vérification de validation de l'ensemble de données après le téléchargement. Par conséquent, en vous assurant que votre ensemble de données est correctement formaté et sans erreur à l'avance, vous pouvez prévenir tout revers dû au rejet de l'ensemble de données.

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Une fois votre fichier ZIP de jeu de données prêt, accédez à la page Jeux de données en cliquant sur le bouton Jeux de données dans la barre latérale, puis cliquez sur le bouton Télécharger le jeu de données en haut à droite de la page.

Capture d'écran Ultralytics HUB de la page Datasets avec une flèche pointant vers le bouton Datasets dans la barre latérale et une autre vers le bouton Upload Dataset

Astuce

Vous pouvez télécharger un jeu de données directement depuis la page d'accueil.

Capture d'écran Ultralytics HUB de la page d'accueil avec une flèche pointant vers la carte Télécharger le jeu de données

Cette action déclenchera la boîte de dialogue Télécharger l'ensemble de données.

Sélectionnez la tâche de jeu de données de votre ensemble de données et téléchargez-la dans le champ Fichier .zip de l'ensemble de données.

Vous avez également la possibilité de définir un nom et une description personnalisés pour votre ensemble de données Ultralytics HUB.

Lorsque vous êtes satisfait de la configuration de votre ensemble de données, cliquez sur Upload.

Capture d'écran Ultralytics HUB de la boîte de dialogue Télécharger l'ensemble de données avec des flèches pointant vers la tâche de l'ensemble de données, le fichier de l'ensemble de données et le bouton Télécharger

Une fois votre ensemble de données téléchargé et traité, vous pourrez y accéder depuis la page Ensembles de données.

Capture d'écran Ultralytics HUB de la page Datasets avec une flèche pointant vers l'un des datasets

Vous pouvez visualiser les images de votre jeu de données regroupées par divisions (Train, Validation, Test).

Capture d'écran Ultralytics HUB de la page Dataset avec une flèche pointant vers l'onglet Images

Astuce

Chaque image peut être agrandie pour une meilleure visualisation.

Capture d'écran Ultralytics HUB de l'onglet Images à l'intérieur de la page Jeu de données avec une flèche pointant vers l'icône d'extension

Capture d'écran Ultralytics HUB de l'onglet Images à l'intérieur de la page Jeu de données avec l'une des images développée

De plus, vous pouvez analyser votre ensemble de données en cliquant sur l'onglet Aperçu.

Capture d'écran Ultralytics HUB de la page Dataset avec une flèche pointant vers l'onglet Overview

Ensuite, entraînez un modèle sur votre jeu de données.

Capture d'écran Ultralytics HUB de la page Jeu de données avec une flèche pointant vers le bouton Entraîner le modèle

Télécharger l'ensemble de données

Accédez à la page Dataset du dataset que vous souhaitez télécharger, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Télécharger. Cette action lancera le téléchargement de votre dataset.

Capture d'écran Ultralytics HUB de la page Dataset avec une flèche pointant vers l'option Download

Astuce

Vous pouvez télécharger un ensemble de données directement depuis la page Ensembles de données.

Capture d'écran Ultralytics HUB de la page Datasets avec une flèche pointant vers l'option Download de l'un des datasets

Partager le jeu de données

Info

La fonctionnalité de partage d'Ultralytics HUB offre un moyen pratique de partager des jeux de données avec d'autres. Cette fonctionnalité est conçue pour s'adapter à la fois aux utilisateurs existants d'Ultralytics HUB et à ceux qui n'ont pas encore créé de compte.

Remarque

Vous avez le contrôle sur l'accès général de vos ensembles de données.

Vous pouvez choisir de définir l'accès général sur "Privé", auquel cas, vous seul y aurez accès. Alternativement, vous pouvez définir l'accès général sur "Non répertorié", ce qui accorde un accès en lecture à toute personne ayant le lien direct vers l'ensemble de données, qu'elle ait ou non un compte Ultralytics HUB.

Accédez à la page Dataset du dataset que vous souhaitez partager, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Partager. Cette action déclenchera la boîte de dialogue Partager le dataset.

Capture d'écran Ultralytics HUB de la page Dataset avec une flèche pointant vers l'option Share

Astuce

Vous pouvez partager un ensemble de données directement depuis la page Datasets.

Capture d'écran Ultralytics HUB de la page Datasets avec une flèche pointant vers l'option Share de l'un des datasets

Définissez l'accès général sur "Non répertorié" et cliquez sur Enregistrer.

Capture d'écran Ultralytics HUB de la boîte de dialogue Partager l'ensemble de données avec une flèche pointant vers le menu déroulant et une autre vers le bouton Enregistrer.

Désormais, toute personne possédant le lien direct vers votre ensemble de données peut le consulter.

Astuce

Vous pouvez facilement cliquer sur le lien de l'ensemble de données affiché dans la boîte de dialogue Partager l'ensemble de données pour le copier.

Capture d'écran Ultralytics HUB de la boîte de dialogue Partager l'ensemble de données avec une flèche pointant vers le lien de l'ensemble de données.

Modifier l'ensemble de données

Accédez à la page Dataset du dataset que vous souhaitez modifier, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Modifier. Cette action déclenchera la boîte de dialogue Mettre à jour le dataset.

Capture d'écran Ultralytics HUB de la page Dataset avec une flèche pointant vers l'option Edit

Astuce

Vous pouvez modifier un jeu de données directement depuis la page Jeux de données.

Capture d'écran Ultralytics HUB de la page Datasets avec une flèche pointant vers l'option Edit de l'un des datasets

Appliquez les modifications souhaitées à votre ensemble de données, puis confirmez les modifications en cliquant sur Enregistrer.

Capture d'écran Ultralytics HUB de la boîte de dialogue Mettre à jour l'ensemble de données avec une flèche pointant vers le bouton Enregistrer

Supprimer l'ensemble de données

Accédez à la page Dataset du dataset que vous souhaitez supprimer, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Supprimer. Cette action supprimera le dataset.

Capture d'écran Ultralytics HUB de la page Dataset avec une flèche pointant vers l'option Delete

Astuce

Vous pouvez supprimer un ensemble de données directement depuis la page Ensembles de données.

Capture d'écran Ultralytics HUB de la page Datasets avec une flèche pointant vers l'option Delete de l'un des datasets

Remarque

Si vous changez d'avis, vous pouvez restaurer l'ensemble de données à partir de la page Corbeille.

Capture d'écran Ultralytics HUB de la page Corbeille avec une flèche pointant vers le bouton Corbeille dans la barre latérale et une autre vers l'option Restaurer de l'un des ensembles de données



📅 Créé il y a 1 an ✏️ Mis à jour il y a 5 mois

Commentaires