Link to this sectionAperçu des jeux de données#

Ultralytics prend en charge divers jeux de données pour faciliter les tâches de vision par ordinateur telles que la détection, la segmentation d'instances, la segmentation sémantique, l'estimation de pose, la classification et le suivi multi-objets. Tu trouveras ci-dessous une liste des principaux jeux de données Ultralytics, suivie d'un résumé de chaque tâche de vision par ordinateur et des jeux de données correspondants.

Watch: Ultralytics Datasets Overview

Link to this section Détection d'objets #

La détection d'objets par boîte englobante est une technique de vision par ordinateur qui consiste à détecter et localiser des objets dans une image en dessinant une boîte autour de chaque objet.

African-wildlife : un jeu de données contenant des images de la faune africaine, incluant des buffles, des éléphants, des rhinocéros et des zèbres.
Argoverse : un jeu de données contenant des données de suivi 3D et de prévision de mouvement issues d'environnements urbains avec des annotations riches.
Brain-tumor : un jeu de données pour la détection de tumeurs cérébrales incluant des images IRM ou scanner avec des détails sur la présence, l'emplacement et les caractéristiques de la tumeur.
COCO : Common Objects in Context (COCO) est un jeu de données à grande échelle pour la détection d'objets, la segmentation et la génération de légendes avec 80 catégories d'objets.
COCO8 : un sous-ensemble plus petit composé des 4 premières images de COCO train et COCO val, adapté pour des tests rapides.
COCO8-Grayscale : une version en niveaux de gris de COCO8 créée en convertissant le RVB en niveaux de gris, utile pour l'évaluation de modèles monocanaux.
COCO8-Multispectral : une version multispectrale à 10 canaux de COCO8 créée par interpolation des longueurs d'onde RVB, utile pour l'évaluation de modèles sensibles au spectre.
COCO128 : un sous-ensemble plus petit composé des 128 premières images de COCO train2017, adapté pour les tests.
Construction-PPE : un jeu de données d'images de chantiers de construction annotées avec des équipements de sécurité essentiels tels que des casques, gilets, gants, bottes et lunettes, ainsi que des étiquettes pour l'équipement manquant, soutenant le développement de modèles d'IA pour la conformité et la protection des travailleurs.
Global Wheat 2020 : un jeu de données contenant des images d'épis de blé pour le Global Wheat Challenge 2020.
HomeObjects-3K : un jeu de données de scènes d'intérieur annotées présentant 12 objets domestiques courants, idéal pour développer et tester des modèles de vision par ordinateur dans les systèmes de maison intelligente, la robotique et la réalité augmentée.
KITTI Nouveau : un jeu de données bien connu pour la conduite autonome incluant des entrées stéréo, LiDAR et GPS/IMU, utilisé pour la détection d'objets 2D dans des scènes routières variées.
LVIS : un jeu de données à grande échelle pour la détection d'objets, la segmentation et la génération de légendes avec 1203 catégories d'objets.
Medical-pills : un jeu de données contenant des images étiquetées de pilules médicales, conçu pour aider dans des tâches comme le contrôle qualité pharmaceutique, le tri et la garantie de conformité aux normes industrielles.
Objects365 : un jeu de données à grande échelle de haute qualité pour la détection d'objets avec 365 catégories d'objets et plus de 600 000 images annotées.
OpenImagesV7 : un jeu de données complet de Google avec 1,7 million d'images d'entraînement et 42 000 images de validation.
RF100 : un benchmark de détection d'objets diversifié avec 100 jeux de données couvrant sept domaines d'imagerie pour une évaluation complète des modèles.
Signature : un jeu de données contenant des images de divers documents avec des signatures annotées, soutenant la recherche sur la vérification de documents et la détection de fraudes.
SKU-110K : un jeu de données présentant la détection d'objets denses dans des environnements de vente au détail avec plus de 11 000 images et 1,7 million de boîtes englobantes.
VisDrone : un jeu de données contenant des données de détection d'objets et de suivi multi-objets issues d'imagerie capturée par drone, avec plus de 10 000 images et séquences vidéo.
VOC : le jeu de données Pascal Visual Object Classes (VOC) pour la détection et la segmentation d'objets avec 20 classes d'objets et plus de 11 000 images.
xView : un jeu de données pour la détection d'objets dans l'imagerie aérienne avec 60 catégories d'objets et plus d'un million d'objets annotés.

Link to this section Segmentation d'instances #

La segmentation d'instances est une technique de vision par ordinateur qui consiste à identifier et localiser des objets dans une image au niveau des pixels. Contrairement à la segmentation sémantique qui classifie seulement chaque pixel, la segmentation d'instances distingue les différentes instances d'une même classe.

Carparts-seg : un jeu de données spécialement conçu pour identifier les pièces de véhicules, répondant aux besoins de conception, de fabrication et de recherche. Il sert à la fois pour des tâches de détection d'objets et de segmentation.
COCO : un jeu de données à grande échelle conçu pour des tâches de détection d'objets, de segmentation et de génération de légendes avec plus de 200 000 images étiquetées.
COCO8-seg : un jeu de données plus petit pour des tâches de segmentation d'instances, contenant un sous-ensemble de 8 images COCO avec des annotations de segmentation.
COCO128-seg : un jeu de données plus petit pour des tâches de segmentation d'instances, contenant un sous-ensemble de 128 images COCO avec des annotations de segmentation.
Crack-seg : un jeu de données spécifiquement conçu pour détecter les fissures sur les routes et les murs, applicable à la fois pour des tâches de détection d'objets et de segmentation.
Package-seg : un jeu de données sur mesure pour identifier les colis dans les entrepôts ou les environnements industriels, adapté pour des applications de détection d'objets et de segmentation.

Link to this section Segmentation sémantique #

La segmentation sémantique assigne une étiquette de classe à chaque pixel dans une image, produisant des cartes de scène denses pour des applications telles que la conduite autonome, l'analyse de scène et la cartographie de l'occupation des sols.

Cityscapes : un jeu de données de segmentation sémantique de scènes de rues urbaines avec 19 classes d'entraînement.
Cityscapes8 : un sous-ensemble compact de Cityscapes de 8 images pour des vérifications rapides de pipelines de segmentation sémantique.
ADE20K : un jeu de données d'analyse de scène avec 150 classes sémantiques.

Link to this section Estimation de pose #

L'estimation de pose est une technique utilisée pour déterminer la pose de l'objet par rapport à la caméra ou au système de coordonnées mondial. Cela implique l'identification de points clés ou d'articulations sur des objets, en particulier des humains ou des animaux.

COCO : un jeu de données à grande échelle avec des annotations de pose humaine conçu pour des tâches d'estimation de pose.
COCO8-pose : un jeu de données plus petit pour des tâches d'estimation de pose, contenant un sous-ensemble de 8 images COCO avec des annotations de pose humaine.
Dog-pose : un jeu de données complet comprenant environ 8 500 images axées sur les chiens, annotées avec 24 points clés par chien, conçu pour des tâches d'estimation de pose.
Hand-Keypoints : un jeu de données concis comprenant plus de 26 000 images centrées sur les mains humaines, annotées avec 21 points clés par main, conçu pour des tâches d'estimation de pose.
Tiger-pose : un jeu de données compact composé de 263 images axées sur les tigres, annotées avec 12 points clés par tigre pour des tâches d'estimation de pose.

Link to this section Classification #

La classification d'images est une tâche de vision par ordinateur qui consiste à catégoriser une image dans une ou plusieurs classes ou catégories prédéfinies en fonction de son contenu visuel.

Caltech 101 : un jeu de données contenant des images de 101 catégories d'objets pour des tâches de classification d'images.
Caltech 256 : une version étendue de Caltech 101 avec 256 catégories d'objets et des images plus difficiles.
CIFAR-10 : un jeu de données de 60 000 images couleur 32x32 réparties en 10 classes, avec 6 000 images par classe.
CIFAR-100 : une version étendue de CIFAR-10 avec 100 catégories d'objets et 600 images par classe.
Fashion-MNIST : un jeu de données composé de 70 000 images en niveaux de gris de 10 catégories de mode pour des tâches de classification d'images.
ImageNet : un jeu de données à grande échelle pour la détection d'objets et la classification d'images avec plus de 14 millions d'images et 20 000 catégories.
ImageNet-10 : un sous-ensemble plus petit d'ImageNet avec 10 catégories pour des expérimentations et des tests plus rapides.
Imagenette : un sous-ensemble plus petit d'ImageNet qui contient 10 classes facilement distinguables pour un entraînement et des tests plus rapides.
Imagewoof : un sous-ensemble plus difficile d'ImageNet contenant 10 catégories de races de chiens pour des tâches de classification d'images.
MNIST : un jeu de données de 70 000 images en niveaux de gris de chiffres manuscrits pour des tâches de classification d'images.
MNIST160 : les 8 premières images de chaque chiffre (0-9) à la fois des jeux d'entraînement et de test de MNIST. Le jeu de données contient 160 images au total.

Link to this section Boîtes englobantes orientées (OBB)#

Les boîtes englobantes orientées (OBB) sont une méthode de vision par ordinateur pour détecter des objets inclinés dans des images en utilisant des boîtes englobantes tournées, souvent appliquées à l'imagerie aérienne et satellite. Contrairement aux boîtes englobantes traditionnelles, l'OBB peut mieux s'adapter aux objets dans diverses orientations.

DOTA-v2 : un jeu de données d'imagerie aérienne OBB populaire avec 1,7 million d'instances et 11 268 images.
DOTA8 : un sous-ensemble plus petit des 8 premières images du jeu de séparation DOTAv1, 4 pour l'entraînement et 4 pour la validation, adapté pour des tests rapides.
DOTA128 : un sous-ensemble de 128 images du jeu de données DOTA avec 128 images pour l'entraînement et la validation, offrant un bon équilibre entre taille et diversité pour tester les modèles OBB.

Link to this section Suivi multi-objets #

Le suivi multi-objets est une technique de vision par ordinateur qui consiste à détecter et suivre plusieurs objets au fil du temps dans une séquence vidéo. Cette tâche étend la détection d'objets en maintenant des identités cohérentes des objets à travers les images.

Argoverse : un jeu de données contenant des données de suivi 3D et de prévision de mouvement issues d'environnements urbains avec des annotations riches pour des tâches de suivi multi-objets.
VisDrone : un jeu de données contenant des données de détection d'objets et de suivi multi-objets issues d'imagerie capturée par drone, avec plus de 10 000 images et séquences vidéo.

Link to this sectionContribuer avec de nouveaux jeux de données#

Contribuer avec un nouveau jeu de données implique plusieurs étapes pour garantir qu'il s'aligne bien avec l'infrastructure existante. Voici les étapes nécessaires :

Watch: How to Contribute to Ultralytics Datasets

Link to this sectionÉtapes pour contribuer avec un nouveau jeu de données#

Collecter les images : Rassemble les images qui appartiennent au jeu de données. Elles peuvent être collectées à partir de diverses sources, telles que des bases de données publiques ou ta propre collection.
Annoter les images : Annote ces images avec des boîtes englobantes, des segments ou des points clés, selon la tâche.
Exporter les annotations : Convertis ces annotations dans le format de fichier YOLO *.txt pris en charge par Ultralytics.
Organiser le jeu de données : Organise ton jeu de données selon la structure de dossiers correcte. Tu dois avoir des répertoires de premier niveau images/ et labels/, et au sein de chacun, un sous-répertoire train/ et val/.
```
dataset/
├── images/
│   ├── train/
│   └── val/
└── labels/
    ├── train/
    └── val/
```
Créer un fichier data.yaml : Dans le répertoire racine de ton jeu de données, crée un fichier data.yaml qui décrit le jeu de données, les classes et toute autre information nécessaire.
Optimiser les images (optionnel) : Si tu souhaites réduire la taille du jeu de données pour un traitement plus efficace, tu peux optimiser les images en utilisant le code ci-dessous. Ce n'est pas requis, mais recommandé pour des tailles de jeux de données plus petites et des vitesses de téléchargement plus rapides.
Ziper le jeu de données : Compresse l'ensemble du dossier du jeu de données en un fichier zip.
Document et PR : Crée une page de documentation décrivant ton dataset et son intégration dans le framework existant. Ensuite, soumets une Pull Request (PR). Consulte les Ultralytics Contribution Guidelines pour plus de détails sur la manière de soumettre une PR.

Link to this sectionExemple de code pour optimiser et ziper un jeu de données#

Optimiser et ziper un jeu de données

   from pathlib import Path

   from ultralytics.data.utils import compress_one_image
   from ultralytics.utils.downloads import zip_directory

   # Define dataset directory
   path = Path("path/to/dataset")

   # Optimize images in dataset (optional)
   for f in path.rglob("*.jpg"):
       compress_one_image(f)

   # Zip dataset into 'path/to/dataset.zip'
   zip_directory(path)

En suivant ces étapes, tu peux contribuer avec un nouveau jeu de données qui s'intègre bien avec la structure existante d'Ultralytics.

Link to this sectionFAQ#

Link to this sectionQuels jeux de données Ultralytics prend-il en charge pour la détection d'objets ?#

Ultralytics prend en charge une grande variété de jeux de données pour la détection d'objets, y compris :

COCO : un jeu de données à grande échelle pour la détection d'objets, la segmentation et la génération de légendes avec 80 catégories d'objets.
LVIS : un jeu de données étendu avec 1203 catégories d'objets, conçu pour une détection d'objets et une segmentation plus fines.
Argoverse : un jeu de données contenant des données de suivi 3D et de prévision de mouvement issues d'environnements urbains avec des annotations riches.
VisDrone : un jeu de données avec des données de détection d'objets et de suivi multi-objets issues d'imagerie capturée par drone.
SKU-110K : présentant une détection d'objets denses dans des environnements de vente au détail avec plus de 11 000 images.

Ces datasets facilitent l'entraînement de modèles Ultralytics YOLO robustes pour diverses applications de détection d'objets.

Link to this sectionComment puis-je contribuer avec un nouveau jeu de données à Ultralytics ?#

Contribuer avec un nouveau jeu de données implique plusieurs étapes :

Collecter les images : Rassemble des images à partir de bases de données publiques ou de collections personnelles.
Annoter les images : Applique des boîtes englobantes, des segments ou des points clés, selon la tâche.
Exporter les annotations : Convertis les annotations dans le format YOLO *.txt.
Organiser le jeu de données : Utilise la structure de dossiers avec les répertoires train/ et val/, chacun contenant des sous-répertoires images/ et labels/.
Créer un fichier data.yaml : Inclus les descriptions du jeu de données, les classes et toute autre information pertinente.
Optimiser les images (optionnel) : Réduis la taille du jeu de données pour plus d'efficacité.
Ziper le jeu de données : Compresse le jeu de données dans un fichier zip.
Document et PR : Décris ton dataset et soumets une Pull Request en suivant les Ultralytics Contribution Guidelines.

Visite Contribuer avec de nouveaux jeux de données pour un guide complet.

Link to this sectionPourquoi devrais-je utiliser la plateforme Ultralytics pour mon jeu de données ?#

Ultralytics Platform propose des fonctionnalités puissantes pour la gestion et l'analyse de tes datasets, notamment :

Gestion fluide des datasets : Télécharge, organise et gère tes datasets en un seul endroit.
Intégration immédiate pour l'entraînement : Utilise les datasets téléchargés directement pour l'entraînement de modèles sans configuration supplémentaire.
Outils de visualisation : Explore et visualise les images et les annotations de ton dataset.
Analyse de dataset : Obtiens des informations sur la distribution et les caractéristiques de ton dataset.

La plateforme simplifie la transition de la gestion des datasets à l'entraînement des modèles, rendant l'ensemble du processus plus efficace. Apprends-en plus sur les Ultralytics Platform Datasets.

Link to this sectionQuelles sont les caractéristiques uniques des modèles Ultralytics YOLO pour la vision par ordinateur ?#

Les modèles Ultralytics YOLO offrent plusieurs caractéristiques uniques pour les tâches de vision par ordinateur :

Performance en temps réel : Capacités d'inférence et d'entraînement à haute vitesse pour les applications sensibles au temps.
Polyvalence : Prise en charge des tâches de détection, segmentation d'instances, segmentation sémantique, classification et estimation de pose dans un framework unifié.
Modèles pré-entraînés : Accès à des modèles pré-entraînés haute performance pour diverses applications, réduisant le temps d'entraînement.
Support communautaire étendu : Une communauté active et une documentation complète pour le dépannage et le développement.
Intégration facile : API simple pour une intégration dans tes projets et workflows existants.

Découvre plus d'informations sur les modèles YOLO sur la page Ultralytics Models.

Link to this sectionComment puis-je optimiser et compresser un dataset en utilisant les outils Ultralytics ?#

Pour optimiser et compresser un dataset avec les outils Ultralytics, suis cet exemple de code :

Optimiser et ziper un jeu de données

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Ce processus aide à réduire la taille du dataset pour un stockage plus efficace et des vitesses de téléchargement plus rapides. Apprends-en davantage sur la façon d'Optimiser et compresser un dataset.

Contributeurs

GLglenn-jocher²³ RIRizwanMunawar¹⁴ LALaughing-q⁴ JKjk4e³ AYAyushExel² RAraimbekovm¹ PDpderrenger¹ FCfcakyon¹ LAlakshanthad¹ MAMatthewNoyce¹ BUBurhan-Q¹ ABabirami-vina¹

Créé 12 nov. 2023Mis à jour il y a 5 jours

Link to this sectionAperçu des jeux de données#

Link to this sectionDétection d'objets#

Link to this sectionSegmentation d'instances#

Link to this sectionSegmentation sémantique#

Link to this sectionEstimation de pose#

Link to this sectionClassification#

Link to this sectionBoîtes englobantes orientées (OBB)#

Link to this sectionSuivi multi-objets#