Préparation des données
La préparation des données est le fondement des modèles de vision par ordinateur réussis. La plateforme Ultralytics fournit des outils complets pour gérer vos données d'entraînement, du téléversement à l'analyse, en passant par l'annotation.
Aperçu
La section Données de la plateforme Ultralytics vous aide à :
- Télécharger des images, des vidéos et des archives (ZIP, TAR, GZ)
- Annoter à l'aide d'outils de dessin manuels et d'étiquetage intelligent SAM
- Analyser vos données avec des statistiques et des visualisations
- Exportation au format NDJSON pour la formation locale

Flux de travail
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Étape | Description |
|---|---|
| Téléversement | Importez des images, des vidéos ou des archives avec traitement automatique |
| Annotation | Étiqueter les données avec des boîtes englobantes, des polygones, des points clés ou des classifications |
| Analyse | Visualiser les distributions de classes, les cartes thermiques spatiales et les statistiques de dimensions |
| Exporter | Télécharger au format NDJSON pour une utilisation hors ligne |
Tâches prises en charge
La plateforme Ultralytics prend en charge les 5 types de tâches YOLO :
| Tâche | Description | Outil d'annotation |
|---|---|---|
| Détecter | Détection d'objets avec des boîtes englobantes | Outil rectangle |
| Segmenter | Segmentation d'instances avec des masques de pixels | Outil polygone |
| Pose | Estimation de points clés (format COCO à 17 points) | Outil de points clés |
| OBB | Boîtes englobantes orientées pour les objets en rotation | Outil de boîtes orientées |
| Classifier | Classification au niveau de l'image | Sélecteur de classe |
Sélection du type de tâche
Le type de tâche est défini lors de la création d'un ensemble de données et détermine les outils d'annotation disponibles. Vous pouvez le modifier ultérieurement à partir des paramètres de l'ensemble de données, mais les annotations incompatibles ne s'afficheront plus après le changement.
Principales caractéristiques
Stockage intelligent
Ultralytics utilise le stockage adressable par contenu (CAS) pour une gestion efficace des données :
- Déduplication: images identiques stockées une seule fois via le hachage XXH3-128
- Intégrité: l'adressage basé sur le hachage garantit l'intégrité des données.
- Efficacité : Stockage optimisé et traitement rapide
URI de jeux de données
Référencer des jeux de données en utilisant le ul:// Format URI (voir Utilisation des jeux de données de la plateforme) :
yolo train data=ul://username/datasets/my-dataset
Cela permet de s'entraîner sur les ensembles de données de la plateforme à partir de n'importe quelle machine sur laquelle votre clé API est configurée.
Utiliser les données de la plateforme depuis Python
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Onglets des ensembles de données
Chaque page de jeu de données comporte cinq onglets :
| Onglet | Description |
|---|---|
| Images | Parcourez les images en mode grille, compact ou tableau avec des annotations superposées. |
| Cours | Afficher et modifier les noms des classes, les couleurs et le nombre d'étiquettes par classe |
| Graphiques | Statistiques automatiques : distribution fractionnée, nombre de classes, cartes thermiques |
| Modèles | Modèles entraînés sur cet ensemble de données avec métriques et statut |
| Erreurs | Images dont le traitement a échoué, avec détails de l'erreur et conseils pour la résoudre |
Statistiques et visualisation
L'argument Charts L'onglet fournit une analyse automatique comprenant :
- Répartition fractionnée: graphique en anneau représentant le nombre d'images train/val/test
- Classes principales: graphique en anneau des classes d'annotation les plus fréquentes
- Largeurs d'image: histogramme de la distribution des largeurs d'image
- Hauteurs d'image: histogramme de la distribution des hauteurs d'image
- Points par instance: distribution du nombre de sommets de polygones ou de points clés (ensembles de donnéessegment)
- Emplacements des annotations: carte thermique 2D des positions centrales des cadres de sélection
- Dimensions de l'image: carte thermique 2D de la largeur par rapport à la hauteur avec lignes de guidage du rapport d'aspect
Liens rapides
- Jeux de données : Téléchargez et gérez vos données d'entraînement
- Annotation : Étiquetage des données avec des outils manuels et assistés par l'IA
FAQ
Quels formats de fichier sont pris en charge pour le téléversement ?
La plateforme Ultralytics prend en charge :
Images : JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (50 Mo maximum chacune)
Vidéos : MP4, WebM, MOV, AVI, MKV, M4V (max. 1 Go, images extraites à 1 image par seconde, max. 100 images)
Archives : ZIP, TAR, TAR.GZ, TGZ, GZ (max. 10 Go) contenant des images avec des étiquettesYOLO en option
Quelle est la taille maximale d'un jeu de données ?
Les limites de stockage dépendent de votre plan :
| Forfait | Limite de stockage |
|---|---|
| Gratuit | 100 Go |
| Pro | 500 Go |
| Entreprise | Personnalisé |
Limites individuelles par fichier : images 50 Mo, vidéos 1 Go, archives 10 Go
Puis-je utiliser mes jeux de données de la Plateforme pour l'entraînement local ?
Oui ! Utilisez le format URI du jeu de données pour l'entraînement local :
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Ou exportez votre ensemble de données au format NDJSON pour une formation entièrement hors ligne.