Link to this sectionPréparation des données#
La préparation des données est le fondement de modèles de computer vision réussis. Ultralytics Platform fournit des outils complets pour gérer tes données d'entraînement, de l'importation à l'analyse en passant par l'annotation.
Watch: Get Started with Ultralytics Platform - Data
Link to this sectionVue d'ensemble#
La section Données de Ultralytics Platform t'aide à :
- Importer des images, des vidéos et des fichiers de jeux de données (ZIP, TAR incluant
.tar.gz/.tgz, NDJSON) - Annoter avec des outils de dessin manuels et l'étiquetage intelligent assisté par SAM — choisis entre SAM 2.1 ou le nouveau SAM 3
- Analyser tes données avec des statistiques et des visualisations
- Exporter au format NDJSON pour un entraînement local

Link to this sectionFlux de travail#
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| Étape | Description |
|---|---|
| Téléverser | Importe des images, vidéos ou archives avec un traitement automatique |
| Annoter | Étiquette tes données avec des outils manuels pour les 6 types de tâches, ou utilise l'annotation SAM pour detect, segment, semantic et OBB |
| Analyser | Consulte les distributions de classes, les cartes de chaleur spatiales et les statistiques de dimension |
| Exporter | Télécharge au format NDJSON pour une utilisation hors ligne |
Link to this sectionTâches prises en charge#
Ultralytics Platform prend en charge les 6 types de tâches YOLO :
| Tâche | Description | Outil d'annotation |
|---|---|---|
| Detect | Détection d'objets avec boîtes englobantes | Outil rectangle |
| Segment | Segmentation d'instance avec masques de pixels | Outil polygone |
| Semantic | Segmentation sémantique avec régions de pixels par classe | Outil polygone |
| Pose | Estimation de points clés avec modèles de squelette intégrés et personnalisés | Outil point clé |
| OBB | Boîtes englobantes orientées pour les objets en rotation | Outil boîte orientée |
| Classify | Classification au niveau de l'image | Sélecteur de classe |
Le type de tâche est défini lors de la création d'un jeu de données et détermine les outils d'annotation disponibles. Tu peux le modifier plus tard depuis le sélecteur de tâche dans l'en-tête du jeu de données, mais les annotations incompatibles ne seront plus affichées après le changement.
Link to this sectionFonctionnalités clés#
Link to this sectionStockage intelligent#
Ultralytics Platform utilise un stockage à adressage par contenu (CAS) pour une gestion efficace des données :
- Dédoublonnage : Les images identiques ne sont stockées qu'une seule fois via le hachage XXH3-128
- Intégrité : L'adressage basé sur le hachage garantit l'intégrité des données
- Efficacité : Stockage optimisé et traitement rapide
Link to this sectionURI des jeux de données#
Référence les jeux de données en utilisant le format d'URI ul:// (voir Utilisation des jeux de données de la plateforme) :
yolo train data=ul://username/datasets/my-datasetCela permet de s'entraîner sur les jeux de données de la plateforme depuis n'importe quelle machine avec ta clé API configurée.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this sectionVersionnage des jeux de données#
Crée des instantanés NDJSON immuables de ton jeu de données pour un entraînement reproductible. Chaque version capture le nombre d'images, de classes et d'annotations au moment de la création. Voir l'onglet Versions pour plus de détails.
Link to this sectionOnglets de jeu de données#
Les pages des jeux de données peuvent afficher jusqu'à six onglets, selon l'état du jeu de données et tes autorisations :
| Onglet | Description |
|---|---|
| Images | Parcours les images en vue grille, compacte ou tableau avec des superpositions d'annotations |
| Classes | Affiche et modifie les noms de classes, les couleurs et le nombre d'étiquettes par classe |
| Graphiques | Statistiques automatiques : distribution des divisions, décompte des classes, cartes de chaleur |
| Modèles | Modèles entraînés sur ce jeu de données avec métriques et statut |
| Versions | Crée et télécharge des instantanés NDJSON immuables pour un entraînement reproductible |
| Erreurs | Images dont le traitement a échoué avec les détails de l'erreur et des conseils de correction |
Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.
Link to this sectionClustering#
Explore ton jeu de données sous forme de nuage de points 2D interactif où les images visuellement similaires sont regroupées — utile pour faire apparaître des clusters, des doublons et des valeurs aberrantes, et pour inspecter comment les divisions ou les classes sont réparties dans tes données. Sélectionne au lasso une zone du graphique pour filtrer la galerie sur ces images. Voir Clustering pour plus de détails.
Link to this sectionStatistiques et visualisation#
The Charts tab provides automatic analysis including:
- Distribution des divisions : Graphique en anneau du nombre d'images d'entraînement/validation/test
- Classes principales : Graphique en anneau des classes d'annotation les plus fréquentes
- Dimensions des images : Histogramme de la distribution de la largeur et de la hauteur des images (en pixels)
- Points par instance : Distribution du nombre de sommets de polygone ou de points clés (jeux de données segment/pose)
- Emplacements des annotations : Carte de chaleur 2D des positions centrales des boîtes englobantes
- Dimensions des images 2D : Carte de chaleur 2D de la largeur vs hauteur avec lignes de guide de rapport hauteur/largeur
Link to this sectionLiens rapides#
- Jeux de données: Importe, gère et exporte tes données d'entraînement
- Annotation: Étiquette tes données avec des outils manuels et assistés par IA
- Entraînement Cloud: Entraîne des modèles sur tes jeux de données annotés
- URI de jeu de données: Utilise les URI
ul://pour t'entraîner depuis n'importe où
Link to this sectionFAQ#
Link to this sectionQuels formats de fichier sont pris en charge pour l'importation ?#
Ultralytics Platform prend en charge :
Images : JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (max 50 Mo chacune)
Vidéos : MP4, WebM, MOV, AVI, MKV, M4V (max 1 Go, images extraites à 1 FPS, max 100 images)
Fichiers de jeu de données : Archives ZIP ou TAR incluant .tar.gz et .tgz (max 10 Go sur Free, 20 Go sur Pro, 50 Go sur Enterprise) contenant des images avec des étiquettes au format YOLO optionnelles, plus des exportations NDJSON
Link to this sectionQuelle est la taille maximale d'un jeu de données ?#
Les limites de stockage dépendent de ton forfait :
| Forfait | Limite de stockage |
|---|---|
| Gratuit | 100 Go |
| Pro | 500 Go |
| Enterprise | Illimité |
Limites de fichier individuel : Images 50 Mo, Vidéos 1 Go, jeux de données 10 Go sur Free / 20 Go sur Pro / 50 Go sur Enterprise
Link to this sectionPuis-je utiliser mes jeux de données de la plateforme pour un entraînement local ?#
Oui ! Utilise le format d'URI de jeu de données pour t'entraîner localement :
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Ou exporte ton jeu de données au format NDJSON pour un entraînement totalement hors ligne.