Passer au contenu

Jeux de données

Les ensembles de données Ultralytics offrent une solution simplifiée pour gérer vos données d'entraînement. Une fois téléchargés, les ensembles de données peuvent être immédiatement utilisés pour l'entraînement des modèles, avec un traitement automatique et la génération de statistiques.


Regarder : Télécharger des ensembles de données sur Ultralytics

Télécharger l'ensemble de données

Ultralytics accepte plusieurs formats de téléchargement pour plus de flexibilité :

FormatDescription
ImagesFichiers image individuels (JPG, PNG, WebP, TIFF, RAW)
Archive ZIPDossier compressé contenant des images et des étiquettes facultatives
VidéoFichiers MP4, AVI - images extraites à environ 1 image par seconde
YOLOStructure YOLO standard avec étiquettes

Extraction d'images vidéo

Lors du téléchargement de vidéos, les images sont automatiquement extraites :

  • Fréquence d'images: environ 1 image par seconde
  • Nombre maximal d'images: 100 images par vidéo
  • Traitement: extraction côté client avant téléchargement
  • Format: Images converties au format standard

C'est idéal pour créer des ensembles de données d'entraînement à partir d'images de vidéosurveillance, d'enregistrements d'actions ou de toute autre source vidéo.

Préparation de votre ensemble de données

Pour les ensembles de données étiquetés, utilisez le YOLO standard :

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Le fichier YAML définit la configuration de votre ensemble de données :

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Processus de téléchargement

  1. Accédez à Datasets dans la barre latérale.
  2. Cliquez sur « Télécharger l'ensemble de données » ou faites glisser les fichiers dans la zone de téléchargement.
  3. Sélectionnez le type de tâche (detect, segment, pose, OBB, classify)
  4. Ajoutez un nom et une description facultative.
  5. Cliquez sur Télécharger

Après le téléchargement, la Plateforme traite vos données :

  1. Normalisation: images volumineuses redimensionnées (max. 4096 px)
  2. Vignettes: aperçus de 256 pixels générés
  3. Analyse des étiquettes: étiquettes YOLO extraites
  4. Statistiques: répartition des classes calculée
Valider avant le téléchargement

Vous pouvez valider votre ensemble de données localement avant de le télécharger :

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Parcourir les images

Affichez les images de votre ensemble de données dans plusieurs mises en page :

AfficherDescription
GrilleGrille de vignettes avec annotations superposées
CompactVignettes plus petites pour un balayage rapide
TableListe avec nom de fichier, dimensions et nombre d'étiquettes

Visionneuse plein écran

Cliquez sur n'importe quelle image pour ouvrir la visionneuse en plein écran avec :

  • Navigation: touches fléchées ou cliquez pour parcourir
  • Métadonnées: nom de fichier, dimensions, fractionnement, nombre d'étiquettes
  • Annotations: Activer/désactiver l'affichage des annotations
  • Répartition par classe: nombre d'étiquettes par classe

Filtrer par fractionnement

Filtrer les images en fonction de la répartition de leur ensemble de données :

DiviserObjectif
EntraînerUtilisé pour l'entraînement des modèles
ValiderUtilisé pour la validation pendant la formation
TestUtilisé pour l'évaluation finale
InconnuAucune répartition attribuée

Statistiques sur les ensembles de données

L'onglet Statistiques fournit une analyse automatique de votre ensemble de données :

classe Distribution

Graphique à barres indiquant le nombre d'annotations par classe :

Carte thermique des emplacements

Visualisation de l'emplacement des annotations dans les images :

Analyse dimensionnelle

Diagramme de dispersion des dimensions des images (largeur vs hauteur) :

Mise en cache des statistiques

Les statistiques sont mises en cache pendant 5 minutes. Les modifications apportées aux annotations seront prises en compte après l'expiration du cache.

Exporter l'ensemble de données

Exportez votre ensemble de données au format NDJSON pour une utilisation hors ligne :

  1. Ouvrez le menu des actions du jeu de données.
  2. Cliquez sur Exporter
  3. Télécharger le fichier NDJSON

Le format NDJSON stocke un objet JSON par ligne :

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

Consultez la documentation sur le formatUltralytics pour obtenir les spécifications complètes.

URI de l'ensemble de données

Ensembles de données de la plateforme de référence utilisant le ul:// Format URI :

ul://username/datasets/dataset-slug

Utilisez cette URI pour entraîner des modèles depuis n'importe où :

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100

Entraînez-vous n'importe où grâce aux données de la plateforme

L'argument ul:// URI fonctionne dans n'importe quel environnement :

  • Machine locale: entraînez-vous sur votre matériel, les données sont téléchargées automatiquement.
  • Google : accédez à vos ensembles de données Platform dans des blocs-notes
  • Serveurs distants: entraînez-vous sur des machines virtuelles dans le cloud avec un accès complet à l'ensemble des données.

Paramètres de visibilité

Contrôlez qui peut voir votre ensemble de données :

ParamètreDescription
PrivéVous seul pouvez accéder à
PublicTout le monde peut consulter la page Explorer.

Pour modifier la visibilité :

  1. Ouvrir le menu des actions sur les ensembles de données
  2. Cliquez sur Modifier
  3. Activer/désactiver le paramètre de visibilité
  4. Cliquez sur Enregistrer

Modifier l'ensemble de données

Mettre à jour le nom, la description ou la visibilité d'un ensemble de données :

  1. Ouvrir le menu des actions sur les ensembles de données
  2. Cliquez sur Modifier
  3. Apporter des modifications
  4. Cliquez sur Enregistrer

Supprimer l'ensemble de données

Supprimez un ensemble de données dont vous n'avez plus besoin :

  1. Ouvrir le menu des actions sur les ensembles de données
  2. Cliquez sur Supprimer
  3. Confirmer la suppression

Supprimer et restaurer

Les ensembles de données supprimés sont déplacés vers la corbeille pendant 30 jours. Vous pouvez les restaurer à partir de la page Corbeille dans Paramètres.

Entraîner sur un ensemble de données

Commencez l'entraînement directement à partir de votre ensemble de données :

  1. Cliquez sur Modèle de train sur la page du jeu de données.
  2. Sélectionnez un projet ou créez-en un nouveau
  3. Configurer les paramètres d'entraînement
  4. Commencer l'entraînement

Pour plus d'informations, consultez la section Formation sur le cloud.

FAQ

Que deviennent mes données après leur téléchargement ?

Vos données sont traitées et stockées dans la région que vous avez sélectionnée (États-Unis, Union européenne ou AP). Les images sont :

  1. Validé pour le format et la taille
  2. Normalisé s'il est supérieur à 4096 px (en conservant le rapport hauteur/largeur)
  3. Stocké à l'aide d'un système de stockage adressable par le contenu (CAS) avec hachage SHA-256
  4. Miniatures générées à 256 pixels pour une navigation rapide
  5. Jamais partagé sans votre permission

Comment fonctionne le stockage ?

Ultralytics utilise le stockage adressable par contenu (CAS) pour un stockage efficace :

  • Déduplication: les images identiques téléchargées par différents utilisateurs ne sont stockées qu'une seule fois.
  • Intégrité: le hachage SHA-256 garantit l'intégrité des données.
  • Efficacité: réduit les coûts de stockage et accélère le traitement
  • Régional: les données restent dans la région que vous avez sélectionnée (États-Unis, Union européenne ou AP).

Puis-je ajouter des images à un ensemble de données existant ?

Oui, utilisez le bouton Ajouter des images sur la page du jeu de données pour télécharger des images supplémentaires. De nouvelles statistiques seront calculées automatiquement.

Comment déplacer des images entre des ensembles de données ?

Utilisez la fonction de sélection groupée :

  1. Sélectionner des images dans la galerie
  2. Cliquez sur Déplacer ou Copier.
  3. Sélectionner l'ensemble de données de destination

Quels formats d'étiquettes sont pris en charge ?

Ultralytics prend en charge les étiquettes YOLO :

  • Détecter: class_id x_center y_center width height
  • Segmenter: class_id x1 y1 x2 y2 ... (points polygonaux)
  • Pose: class_id x_center y_center width height kp1_x kp1_y kp1_v ...
  • OBB: class_id x1 y1 x2 y2 x3 y3 x4 y4

Toutes les coordonnées sont normalisées (plage 0-1).



📅 Créé il y a 0 jour ✏️ Mis à jour il y a 0 jour
glenn-jocher

Commentaires