Préparation des données
La préparation des données est la base de modèles de vision par ordinateur performants. Ultralytics Platform propose des outils complets pour gérer tes données d'entraînement, du téléchargement à l'analyse, en passant par l'annotation.
Watch: Get Started with Ultralytics Platform - Data
Présentation
La section Données de Ultralytics Platform t'aide à :
- Télécharger des images, des vidéos et des fichiers de jeux de données (ZIP, TAR incluant
.tar.gz/.tgz, NDJSON) - Annoter avec des outils de dessin manuel et un étiquetage intelligent alimenté par SAM — choisis entre SAM 2.1 ou le nouveau SAM 3
- Analyser tes données avec des statistiques et des visualisations
- Exporter au format NDJSON pour un entraînement local

Flux de travail
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| Étape | Description |
|---|---|
| Télécharger | Importe des images, des vidéos ou des archives avec un traitement automatique |
| Annoter | Étiquette tes données avec des outils manuels pour les 5 types de tâches, ou utilise l'annotation SAM pour la détection, la segmentation et l'OBB |
| Analyser | Visualise les distributions des classes, les cartes thermiques spatiales et les statistiques de dimension |
| Exporter | Télécharge au format NDJSON pour une utilisation hors ligne |
Tâches prises en charge
Ultralytics Platform prend en charge les 5 types de tâches YOLO :
| Tâche | Description | Outil d'annotation |
|---|---|---|
| Détection | Détection d'objets avec des boîtes englobantes (bounding boxes) | Outil rectangle |
| Segmentation | Segmentation d'instance avec des masques de pixels | Outil polygone |
| Pose | Estimation de points clés avec des modèles de squelette intégrés et personnalisés | Outil de points clés |
| OBB | Boîtes englobantes orientées pour les objets en rotation | Outil de boîte orientée |
| Classification | Classification au niveau de l'image | Sélecteur de classe |
Le type de tâche est défini lors de la création d'un jeu de données et détermine quels outils d'annotation sont disponibles. Tu peux le modifier ultérieurement depuis le sélecteur de tâche dans l'en-tête du jeu de données, mais les annotations incompatibles ne seront plus affichées après le changement.
Fonctionnalités clés
Stockage intelligent
Ultralytics Platform utilise le stockage à adressage par contenu (CAS) pour une gestion efficace des données :
- Déduplication : Les images identiques ne sont stockées qu'une seule fois via le hachage XXH3-128
- Intégrité : L'adressage basé sur le hachage garantit l'intégrité des données
- Efficacité : Stockage optimisé et traitement rapide
URI de jeu de données
Référence tes jeux de données en utilisant le format d'URI ul:// (voir Utiliser les jeux de données de la plateforme) :
yolo train data=ul://username/datasets/my-datasetCela te permet de t'entraîner sur les jeux de données de la plateforme depuis n'importe quelle machine avec ta clé API configurée.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Gestion des versions des jeux de données
Crée des instantanés NDJSON immuables de ton jeu de données pour un entraînement reproductible. Chaque version capture le nombre d'images, de classes et d'annotations au moment de la création. Voir l'onglet Versions pour plus de détails.
Onglets du jeu de données
Les pages de jeux de données peuvent afficher jusqu'à six onglets, selon l'état du jeu de données et tes autorisations :
| Onglet | Description |
|---|---|
| Images | Parcours les images en vue grille, compacte ou tableau avec des superpositions d'annotations |
| Classes | Affiche et modifie les noms des classes, les couleurs et le nombre d'étiquettes par classe |
| Graphiques | Statistiques automatiques : distribution des divisions, décomptes des classes, cartes thermiques |
| Modèles | Modèles entraînés sur ce jeu de données avec des métriques et un état |
| Versions | Crée et télécharge des instantanés NDJSON immuables pour un entraînement reproductible |
| Erreurs | Images ayant échoué au traitement avec des détails sur les erreurs et des conseils de correction |
Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.
Clustering
Explore ton jeu de données sous forme de nuage de points 2D interactif où les images visuellement similaires sont regroupées — utile pour faire ressortir des clusters, des doublons et des valeurs aberrantes, et pour inspecter la répartition des divisions ou des classes dans tes données. Utilise le lasso sur une zone du tracé pour filtrer la galerie sur ces images. Voir Clustering pour plus de détails.
Statistiques et visualisation
The Charts tab provides automatic analysis including:
- Distribution des divisions : Graphique en anneau du nombre d'images d'entraînement/validation/test
- Classes principales : Graphique en anneau des classes d'annotation les plus fréquentes
- Largeurs d'image : Histogramme de la distribution de la largeur des images
- Hauteurs d'image : Histogramme de la distribution de la hauteur des images
- Points par instance : Distribution du nombre de sommets de polygone ou de points clés (jeux de données segment/pose)
- Emplacements des annotations : Carte thermique 2D des positions centrales des boîtes englobantes
- Dimensions de l'image : Carte thermique 2D de la largeur par rapport à la hauteur avec des lignes de guidage pour le rapport hauteur/largeur
Liens rapides
- Jeux de données : Télécharge, gère et exporte tes données d'entraînement
- Annotation : Étiquette tes données avec des outils manuels et assistés par IA
- Entraînement Cloud : Entraîne tes modèles sur tes jeux de données annotés
- URI de jeu de données : Utilise les URI
ul://pour t'entraîner depuis n'importe où
FAQ
Quels formats de fichier sont pris en charge pour le téléchargement ?
Ultralytics Platform prend en charge :
Images : JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (50 Mo max chacune)
Vidéos : MP4, WebM, MOV, AVI, MKV, M4V (1 Go max, images extraites à 1 FPS, 100 images max)
Fichiers de jeu de données : Archives ZIP ou TAR incluant .tar.gz et .tgz (10 Go max sur Free, 20 Go sur Pro, 50 Go sur Enterprise) contenant des images avec des étiquettes au format YOLO optionnelles, plus des exportations NDJSON
Quelle est la taille maximale du jeu de données ?
Les limites de stockage dépendent de ton plan :
| Plan | Limite de stockage |
|---|---|
| Gratuit | 100 Go |
| Pro | 500 Go |
| Entreprise | Illimité |
Limites par fichier : Images 50 Mo, Vidéos 1 Go, jeux de données 10 Go sur Free / 20 Go sur Pro / 50 Go sur Enterprise
Puis-je utiliser mes jeux de données de la plateforme pour un entraînement local ?
Oui ! Utilise le format d'URI du jeu de données pour t'entraîner localement :
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Ou exporte ton jeu de données au format NDJSON pour un entraînement entièrement hors ligne.