Ensembles de données Ultralytics HUB
Les ensembles de données Ultralytics HUB sont une solution pratique pour gérer et exploiter vos ensembles de données personnalisés.
Une fois téléchargés, les ensembles de données peuvent être immédiatement utilisés pour l'entraînement du modèle. Cette approche intégrée facilite une transition transparente de la gestion des ensembles de données à l'entraînement du modèle, simplifiant considérablement l'ensemble du processus.
Regarder : Télécharger des ensembles de données vers Ultralytics HUB | Procédure complète de la fonctionnalité de téléchargement d'ensembles de données
Télécharger l'ensemble de données
Les ensembles de données Ultralytics HUB sont comme les ensembles de données YOLOv5 et YOLOv8 🚀. Ils utilisent la même structure et les mêmes formats d'étiquettes pour que tout reste simple.
Avant de télécharger un ensemble de données sur Ultralytics HUB, assurez-vous de placer votre fichier YAML d'ensemble de données dans le répertoire racine de l'ensemble de données et que votre fichier YAML d'ensemble de données, votre répertoire et votre ZIP ont le même nom, comme indiqué dans l'exemple ci-dessous, puis compressez le répertoire de l'ensemble de données.
Par exemple, si votre ensemble de données est appelé « coco8 », comme le nôtre COCO8 exemple de jeu de données, vous devriez avoir un coco8.yaml
à l'intérieur de votre coco8/
répertoire, ce qui créera un coco8.zip
lorsqu'il est compressé :
zip -r coco8.zip coco8
Vous pouvez télécharger notre exemple d'ensemble de données COCO8 et le décompresser pour voir exactement comment structurer votre ensemble de données.
Le fichier YAML de l'ensemble de données est le même format YAML standard YOLOv5 et YOLOv8.
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
Après avoir compressé votre ensemble de données, vous devez le valider avant de le télécharger sur Ultralytics HUB. Ultralytics HUB effectue la vérification de validation de l'ensemble de données après le téléchargement. Par conséquent, en vous assurant que votre ensemble de données est correctement formaté et sans erreur à l'avance, vous pouvez prévenir tout revers dû au rejet de l'ensemble de données.
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Une fois votre fichier ZIP de jeu de données prêt, accédez à la page Jeux de données en cliquant sur le bouton Jeux de données dans la barre latérale, puis cliquez sur le bouton Télécharger le jeu de données en haut à droite de la page.
Cette action déclenchera la boîte de dialogue Télécharger l'ensemble de données.
Sélectionnez la tâche de jeu de données de votre ensemble de données et téléchargez-la dans le champ Fichier .zip de l'ensemble de données.
Vous avez également la possibilité de définir un nom et une description personnalisés pour votre ensemble de données Ultralytics HUB.
Lorsque vous êtes satisfait de la configuration de votre ensemble de données, cliquez sur Upload.
Une fois votre ensemble de données téléchargé et traité, vous pourrez y accéder depuis la page Ensembles de données.
Vous pouvez visualiser les images de votre jeu de données regroupées par divisions (Train, Validation, Test).
Astuce
Chaque image peut être agrandie pour une meilleure visualisation.
De plus, vous pouvez analyser votre ensemble de données en cliquant sur l'onglet Aperçu.
Ensuite, entraînez un modèle sur votre jeu de données.
Télécharger l'ensemble de données
Accédez à la page Dataset du dataset que vous souhaitez télécharger, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Télécharger. Cette action lancera le téléchargement de votre dataset.
Astuce
Vous pouvez télécharger un ensemble de données directement depuis la page Ensembles de données.
Partager le jeu de données
Info
La fonctionnalité de partage d'Ultralytics HUB offre un moyen pratique de partager des jeux de données avec d'autres. Cette fonctionnalité est conçue pour s'adapter à la fois aux utilisateurs existants d'Ultralytics HUB et à ceux qui n'ont pas encore créé de compte.
Remarque
Vous avez le contrôle sur l'accès général de vos ensembles de données.
Vous pouvez choisir de définir l'accès général sur "Privé", auquel cas, vous seul y aurez accès. Alternativement, vous pouvez définir l'accès général sur "Non répertorié", ce qui accorde un accès en lecture à toute personne ayant le lien direct vers l'ensemble de données, qu'elle ait ou non un compte Ultralytics HUB.
Accédez à la page Dataset du dataset que vous souhaitez partager, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Partager. Cette action déclenchera la boîte de dialogue Partager le dataset.
Définissez l'accès général sur "Non répertorié" et cliquez sur Enregistrer.
Désormais, toute personne possédant le lien direct vers votre ensemble de données peut le consulter.
Astuce
Vous pouvez facilement cliquer sur le lien de l'ensemble de données affiché dans la boîte de dialogue Partager l'ensemble de données pour le copier.
Modifier l'ensemble de données
Accédez à la page Dataset du dataset que vous souhaitez modifier, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Modifier. Cette action déclenchera la boîte de dialogue Mettre à jour le dataset.
Appliquez les modifications souhaitées à votre ensemble de données, puis confirmez les modifications en cliquant sur Enregistrer.
Supprimer l'ensemble de données
Accédez à la page Dataset du dataset que vous souhaitez supprimer, ouvrez le menu déroulant des actions du dataset et cliquez sur l'option Supprimer. Cette action supprimera le dataset.
Astuce
Vous pouvez supprimer un ensemble de données directement depuis la page Ensembles de données.
Remarque
Si vous changez d'avis, vous pouvez restaurer l'ensemble de données à partir de la page Corbeille.