Jeux de données
Les ensembles de données Ultralytics offrent une solution simplifiée pour gérer vos données d'entraînement. Une fois téléchargés, les ensembles de données peuvent être immédiatement utilisés pour l'entraînement des modèles, avec un traitement automatique et la génération de statistiques.
Regarder : Télécharger des ensembles de données sur Ultralytics
Télécharger l'ensemble de données
Ultralytics accepte plusieurs formats de téléchargement pour plus de flexibilité :
| Format | Description |
|---|---|
| Images | Fichiers image individuels (JPG, PNG, WebP, TIFF, RAW) |
| Archive ZIP | Dossier compressé contenant des images et des étiquettes facultatives |
| Vidéo | Fichiers MP4, AVI - images extraites à environ 1 image par seconde |
| YOLO | Structure YOLO standard avec étiquettes |
Extraction d'images vidéo
Lors du téléchargement de vidéos, les images sont automatiquement extraites :
- Fréquence d'images: environ 1 image par seconde
- Nombre maximal d'images: 100 images par vidéo
- Traitement: extraction côté client avant téléchargement
- Format: Images converties au format standard
C'est idéal pour créer des ensembles de données d'entraînement à partir d'images de vidéosurveillance, d'enregistrements d'actions ou de toute autre source vidéo.
Préparation de votre ensemble de données
Pour les ensembles de données étiquetés, utilisez le YOLO standard :
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
Le fichier YAML définit la configuration de votre ensemble de données :
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
Processus de téléchargement
- Accédez à Datasets dans la barre latérale.
- Cliquez sur « Télécharger l'ensemble de données » ou faites glisser les fichiers dans la zone de téléchargement.
- Sélectionnez le type de tâche (detect, segment, pose, OBB, classify)
- Ajoutez un nom et une description facultative.
- Cliquez sur Télécharger
Après le téléchargement, la Plateforme traite vos données :
- Normalisation: images volumineuses redimensionnées (max. 4096 px)
- Vignettes: aperçus de 256 pixels générés
- Analyse des étiquettes: étiquettes YOLO extraites
- Statistiques: répartition des classes calculée
Valider avant le téléchargement
Vous pouvez valider votre ensemble de données localement avant de le télécharger :
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Parcourir les images
Affichez les images de votre ensemble de données dans plusieurs mises en page :
| Afficher | Description |
|---|---|
| Grille | Grille de vignettes avec annotations superposées |
| Compact | Vignettes plus petites pour un balayage rapide |
| Table | Liste avec nom de fichier, dimensions et nombre d'étiquettes |
Visionneuse plein écran
Cliquez sur n'importe quelle image pour ouvrir la visionneuse en plein écran avec :
- Navigation: touches fléchées ou cliquez pour parcourir
- Métadonnées: nom de fichier, dimensions, fractionnement, nombre d'étiquettes
- Annotations: Activer/désactiver l'affichage des annotations
- Répartition par classe: nombre d'étiquettes par classe
Filtrer par fractionnement
Filtrer les images en fonction de la répartition de leur ensemble de données :
| Diviser | Objectif |
|---|---|
| Entraîner | Utilisé pour l'entraînement des modèles |
| Valider | Utilisé pour la validation pendant la formation |
| Test | Utilisé pour l'évaluation finale |
| Inconnu | Aucune répartition attribuée |
Statistiques sur les ensembles de données
L'onglet Statistiques fournit une analyse automatique de votre ensemble de données :
classe Distribution
Graphique à barres indiquant le nombre d'annotations par classe :
Carte thermique des emplacements
Visualisation de l'emplacement des annotations dans les images :
Analyse dimensionnelle
Diagramme de dispersion des dimensions des images (largeur vs hauteur) :
Mise en cache des statistiques
Les statistiques sont mises en cache pendant 5 minutes. Les modifications apportées aux annotations seront prises en compte après l'expiration du cache.
Exporter l'ensemble de données
Exportez votre ensemble de données au format NDJSON pour une utilisation hors ligne :
- Ouvrez le menu des actions du jeu de données.
- Cliquez sur Exporter
- Télécharger le fichier NDJSON
Le format NDJSON stocke un objet JSON par ligne :
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
Consultez la documentation sur le formatUltralytics pour obtenir les spécifications complètes.
URI de l'ensemble de données
Ensembles de données de la plateforme de référence utilisant le ul:// Format URI :
ul://username/datasets/dataset-slug
Utilisez cette URI pour entraîner des modèles depuis n'importe où :
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100
Entraînez-vous n'importe où grâce aux données de la plateforme
L'argument ul:// URI fonctionne dans n'importe quel environnement :
- Machine locale: entraînez-vous sur votre matériel, les données sont téléchargées automatiquement.
- Google : accédez à vos ensembles de données Platform dans des blocs-notes
- Serveurs distants: entraînez-vous sur des machines virtuelles dans le cloud avec un accès complet à l'ensemble des données.
Paramètres de visibilité
Contrôlez qui peut voir votre ensemble de données :
| Paramètre | Description |
|---|---|
| Privé | Vous seul pouvez accéder à |
| Public | Tout le monde peut consulter la page Explorer. |
Pour modifier la visibilité :
- Ouvrir le menu des actions sur les ensembles de données
- Cliquez sur Modifier
- Activer/désactiver le paramètre de visibilité
- Cliquez sur Enregistrer
Modifier l'ensemble de données
Mettre à jour le nom, la description ou la visibilité d'un ensemble de données :
- Ouvrir le menu des actions sur les ensembles de données
- Cliquez sur Modifier
- Apporter des modifications
- Cliquez sur Enregistrer
Supprimer l'ensemble de données
Supprimez un ensemble de données dont vous n'avez plus besoin :
- Ouvrir le menu des actions sur les ensembles de données
- Cliquez sur Supprimer
- Confirmer la suppression
Supprimer et restaurer
Les ensembles de données supprimés sont déplacés vers la corbeille pendant 30 jours. Vous pouvez les restaurer à partir de la page Corbeille dans Paramètres.
Entraîner sur un ensemble de données
Commencez l'entraînement directement à partir de votre ensemble de données :
- Cliquez sur Modèle de train sur la page du jeu de données.
- Sélectionnez un projet ou créez-en un nouveau
- Configurer les paramètres d'entraînement
- Commencer l'entraînement
Pour plus d'informations, consultez la section Formation sur le cloud.
FAQ
Que deviennent mes données après leur téléchargement ?
Vos données sont traitées et stockées dans la région que vous avez sélectionnée (États-Unis, Union européenne ou AP). Les images sont :
- Validé pour le format et la taille
- Normalisé s'il est supérieur à 4096 px (en conservant le rapport hauteur/largeur)
- Stocké à l'aide d'un système de stockage adressable par le contenu (CAS) avec hachage SHA-256
- Miniatures générées à 256 pixels pour une navigation rapide
- Jamais partagé sans votre permission
Comment fonctionne le stockage ?
Ultralytics utilise le stockage adressable par contenu (CAS) pour un stockage efficace :
- Déduplication: les images identiques téléchargées par différents utilisateurs ne sont stockées qu'une seule fois.
- Intégrité: le hachage SHA-256 garantit l'intégrité des données.
- Efficacité: réduit les coûts de stockage et accélère le traitement
- Régional: les données restent dans la région que vous avez sélectionnée (États-Unis, Union européenne ou AP).
Puis-je ajouter des images à un ensemble de données existant ?
Oui, utilisez le bouton Ajouter des images sur la page du jeu de données pour télécharger des images supplémentaires. De nouvelles statistiques seront calculées automatiquement.
Comment déplacer des images entre des ensembles de données ?
Utilisez la fonction de sélection groupée :
- Sélectionner des images dans la galerie
- Cliquez sur Déplacer ou Copier.
- Sélectionner l'ensemble de données de destination
Quels formats d'étiquettes sont pris en charge ?
Ultralytics prend en charge les étiquettes YOLO :
- Détecter:
class_id x_center y_center width height - Segmenter:
class_id x1 y1 x2 y2 ...(points polygonaux) - Pose:
class_id x_center y_center width height kp1_x kp1_y kp1_v ... - OBB:
class_id x1 y1 x2 y2 x3 y3 x4 y4
Toutes les coordonnées sont normalisées (plage 0-1).