Aperçu des ensembles de données de détection d'objets
Training a robust and accurate object detection model requires a comprehensive dataset. This guide introduces various formats of datasets that are compatible with the Ultralytics YOLO model and provides insights into their structure, usage, and how to convert between different formats.
Formats de données pris en charge
Ultralytics YOLO format
Le format Ultralytics YOLO est un format de configuration du jeu de données qui te permet de définir le répertoire racine du jeu de données, les chemins relatifs vers les répertoires d'images d'entraînement/de validation/de test ou les chemins relatifs vers les répertoires d'images d'entraînement/de validation/de test. *.txt
des fichiers contenant les chemins d'accès aux images, et un dictionnaire de noms de classes. Voici un exemple :
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes (80 COCO classes)
names:
0: person
1: bicycle
2: car
# ...
77: teddy bear
78: hair drier
79: toothbrush
Les étiquettes de ce format doivent être exportées au format YOLO avec une *.txt
par image. S'il n'y a pas d'objets dans une image, aucune *.txt
est nécessaire. Le *.txt
Le fichier doit être formaté avec une ligne par objet en class x_center y_center width height
format. Les coordonnées de la boîte doivent être en xywh normalisé (de 0 à 1). Si tes cases sont en pixels, tu dois diviser x_center
et width
par la largeur de l'image, et y_center
et height
par la hauteur de l'image. Les numéros de classe doivent être indexés à zéro (commencer par 0).
Le fichier d'Ă©tiquettes correspondant Ă l'image ci-dessus contient 2 personnes (classe 0
) et une égalité (classe 27
) :
Lorsque tu utilises le format Ultralytics YOLO , organise tes images et tes étiquettes de formation et de validation comme indiqué dans l'exemple de l'ensemble de données COCO8 ci-dessous.
Utilisation
Voici comment tu peux utiliser ces formats pour entraîner ton modèle :
Exemple
Ensembles de données pris en charge
Voici une liste des ensembles de données pris en charge et une brève description de chacun d'entre eux :
- Argoverse: Un ensemble de données contenant des données de suivi 3D et de prévision de mouvement provenant d'environnements urbains avec de riches annotations.
- COCO: Common Objects in Context (COCO) est un ensemble de données à grande échelle sur la détection, la segmentation et le sous-titrage d'objets comprenant 80 catégories d'objets.
- LVIS: un ensemble de données à grande échelle pour la détection, la segmentation et le sous-titrage d'objets, comprenant 1203 catégories d'objets.
- COCO8: Un sous-ensemble plus petit des 4 premières images de COCO train et COCO val, adapté aux tests rapides.
- COCO128: A smaller subset of the first 128 images from COCO train and COCO val, suitable for tests.
- Global Wheat 2020: Un ensemble de données contenant des images d'épis de blé pour le Global Wheat Challenge 2020.
- Objets365: Un ensemble de données à grande échelle de haute qualité pour la détection d'objets avec 365 catégories d'objets et plus de 600K images annotées.
- OpenImagesV7: Un ensemble de données complet de Google avec 1,7 million d'images d'entraînement et 42 000 images de validation.
- SKU-110K: Un ensemble de données comprenant la détection d'objets denses dans des environnements de vente au détail avec plus de 11 000 images et 1,7 million de boîtes de délimitation.
- VisDrone: Un ensemble de données contenant des données de détection d'objets et de suivi d'objets multiples à partir d'images capturées par des drones, avec plus de 10 000 images et séquences vidéo.
- VOC: L'ensemble de données Pascal Visual Object Classes (VOC) pour la détection et la segmentation d'objets avec 20 classes d'objets et plus de 11 000 images.
- xView: Un ensemble de données pour la détection d'objets dans les images aériennes avec 60 catégories d'objets et plus d'un million d'objets annotés.
- Roboflow 100: Un benchmark de détection d'objets divers avec 100 ensembles de données couvrant sept domaines d'imagerie pour une évaluation complète des modèles.
- Tumeur cérébrale: Un ensemble de données pour détecter les tumeurs cérébrales comprend des images d'IRM ou de tomodensitométrie avec des détails sur la présence, l'emplacement et les caractéristiques de la tumeur.
- Faune africaine: Un ensemble de données comprenant des images de la faune africaine, notamment de buffles, d'éléphants, de rhinocéros et de zèbres.
- Signature: Un ensemble de données comprenant des images de divers documents avec des signatures annotées, soutenant la recherche sur la vérification des documents et la détection des fraudes.
Ajouter ton propre jeu de données
Si tu as ton propre jeu de données et que tu souhaites l'utiliser pour entraîner des modèles de détection avec le format Ultralytics YOLO , assure-toi qu'il respecte le format spécifié ci-dessus sous "Ultralytics YOLO format ". Convertis tes annotations au format requis et spécifie les chemins, le nombre de classes et les noms des classes dans le fichier de configuration YAML.
Porter ou convertir les formats d'Ă©tiquettes
Format des ensembles de données COCO au format YOLO
Tu peux facilement convertir les étiquettes du format de jeu de données populaire COCO au format YOLO à l'aide de l'extrait de code suivant :
Exemple
Cet outil de conversion peut être utilisé pour convertir le jeu de données COCO ou tout autre jeu de données au format COCO au format Ultralytics YOLO .
N'oublie pas de vérifier que le jeu de données que tu veux utiliser est compatible avec ton modèle et qu'il respecte les conventions de format nécessaires. Des ensembles de données correctement formatés sont essentiels pour former des modèles de détection d'objets performants.
FAQ
Quel est le format du jeu de données Ultralytics YOLO et comment le structurer ?
Le format Ultralytics YOLO est une configuration structurée pour définir les ensembles de données dans tes projets de formation. Il s'agit de définir les chemins d'accès à tes images d'entraînement, de validation et de test, ainsi que les étiquettes correspondantes. Par exemple :
path: ../datasets/coco8 # dataset root directory
train: images/train # training images (relative to 'path')
val: images/val # validation images (relative to 'path')
test: # optional test images
names:
0: person
1: bicycle
2: car
# ...
Les étiquettes sont sauvegardées dans *.txt
avec un fichier par image, formaté comme suit class x_center y_center width height
avec des coordonnées normalisées. Pour un guide détaillé, voir le Exemple de jeu de données COCO8.
Comment convertir un jeu de données COCO au format YOLO ?
Tu peux convertir un jeu de données COCO au format YOLO en utilisant les outils de conversion Ultralytics . Voici une méthode rapide :
from ultralytics.data.converter import convert_coco
convert_coco(labels_dir="path/to/coco/annotations/")
Ce code convertira tes annotations COCO au format YOLO , ce qui permettra une intégration transparente avec les modèles Ultralytics YOLO . Pour plus de détails, visite la section Porter ou convertir les formats d'étiquettes.
Quels ensembles de données sont pris en charge par Ultralytics YOLO pour la détection d'objets ?
Ultralytics YOLO prend en charge un large éventail d'ensembles de données, y compris :
Each dataset page provides detailed information on the structure and usage tailored for efficient YOLO11 training. Explore the full list in the Supported Datasets section.
How do I start training a YOLO11 model using my dataset?
To start training a YOLO11 model, ensure your dataset is formatted correctly and the paths are defined in a YAML file. Use the following script to begin training:
Exemple
Reporte-toi à la section Utilisation pour plus de détails sur l'utilisation des différents modes, y compris les commandes CLI .
Où puis-je trouver des exemples pratiques d'utilisation de Ultralytics YOLO pour la détection d'objets ?
Ultralytics provides numerous examples and practical guides for using YOLO11 in diverse applications. For a comprehensive overview, visit the Ultralytics Blog where you can find case studies, detailed tutorials, and community stories showcasing object detection, segmentation, and more with YOLO11. For specific examples, check the Usage section in the documentation.