Link to this sectionPréparation des données#
La préparation des données est la base de modèles de vision par ordinateur performants. Ultralytics Platform fournit des outils complets pour gérer tes données d'entraînement, du téléchargement à l'analyse en passant par l'annotation.
Watch: Get Started with Ultralytics Platform - Data
Link to this sectionPrésentation#
La section Données d'Ultralytics Platform t'aide à :
- Téléverser des images, des vidéos et des fichiers de jeux de données (ZIP, TAR incluant
.tar.gz/.tgz, NDJSON) - Annoter avec des outils de dessin manuel et l'étiquetage intelligent propulsé par SAM — choisis entre SAM 2.1 ou le nouveau SAM 3
- Analyser tes données avec des statistiques et des visualisations
- Exporter au format NDJSON pour un entraînement local

Link to this sectionFlux de travail#
graph LR
A[Upload]:::start --> B[Annotate]:::proc
B --> C[Analyze]:::proc
C --> D[Train]:::out
classDef start fill:#4CAF50,color:#fff
classDef proc fill:#2196F3,color:#fff
classDef out fill:#9C27B0,color:#fff| Étape | Description |
|---|---|
| Upload | Importe des images, des vidéos ou des archives avec un traitement automatique |
| Annoter | Étiquette tes données avec des outils manuels pour les 6 types de tâches, ou utilise l'annotation SAM pour la détection, la segmentation, la segmentation sémantique et l'OBB |
| Analyser | Visualise les distributions de classes, les cartes thermiques spatiales et les statistiques de dimensions |
| Exporter | Télécharge au format NDJSON pour une utilisation hors ligne |
Link to this sectionTâches prises en charge#
Ultralytics Platform prend en charge les 6 types de tâches YOLO :
| Tâche | Description | Outil d'annotation |
|---|---|---|
| Détection | Détection d'objets avec des boîtes englobantes (BBox) | Outil rectangle |
| Segmentation | Segmentation d'instance avec des masques de pixels | Outil polygone |
| Sémantique | Segmentation sémantique avec des régions de pixels par classe | Outil polygone |
| Pose | Estimation de points clés avec des modèles de squelette intégrés et personnalisés | Outil points clés |
| OBB | Boîtes englobantes orientées pour les objets en rotation | Outil boîte orientée |
| Classification | Classification au niveau de l'image | Sélecteur de classe |
Le type de tâche est défini lors de la création d'un jeu de données et détermine les outils d'annotation disponibles. Tu peux le modifier plus tard via le sélecteur de tâches dans l'en-tête du jeu de données, mais les annotations incompatibles ne seront plus affichées après le changement.
Link to this sectionFonctionnalités clés#
Link to this sectionStockage intelligent#
Ultralytics Platform utilise le stockage adressable par contenu (CAS) pour une gestion efficace des données :
- Dédoublonnage : les images identiques ne sont stockées qu'une seule fois via le hachage XXH3-128
- Intégrité : l'adressage basé sur le hachage garantit l'intégrité des données
- Efficacité : stockage optimisé et traitement rapide
Link to this sectionURI de jeux de données#
Référence les jeux de données en utilisant le format d'URI ul:// (voir Utilisation des jeux de données de la plateforme) :
yolo train data=ul://username/datasets/my-datasetCela permet de s'entraîner sur les jeux de données de la plateforme depuis n'importe quelle machine avec ta clé API configurée.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this sectionVersionnage des jeux de données#
Crée des instantanés NDJSON immuables de ton jeu de données pour un entraînement reproductible. Chaque version capture le nombre d'images, le nombre de classes et le nombre d'annotations au moment de la création. Voir l'onglet Versions pour plus de détails.
Link to this sectionOnglets de jeu de données#
Les pages des jeux de données peuvent afficher jusqu'à six onglets, en fonction de l'état du jeu de données et de tes autorisations :
| Onglet | Description |
|---|---|
| Images | Parcours les images dans une vue en grille, compacte ou en tableau avec des superpositions d'annotations |
| Classes | Visualise et modifie les noms de classes, les couleurs et le nombre d'étiquettes par classe |
| Graphiques | Statistiques automatiques : distribution des divisions, nombre de classes, cartes thermiques |
| Modèles | Modèles entraînés sur ce jeu de données avec des métriques et un état |
| Versions | Crée et télécharge des instantanés NDJSON immuables pour un entraînement reproductible |
| Errors | Images ayant échoué au traitement avec des détails sur les erreurs et des conseils de correction |
Classes et Charts apparaissent quand le jeu de données contient des images. Errors n'apparaît que si des échecs de traitement existent. Versions apparaît pour les propriétaires, ou pour les non-propriétaires quand des versions existent déjà.
Link to this sectionClustering#
Explore ton jeu de données sous forme de nuage de points 2D interactif où les images visuellement similaires sont regroupées — utile pour identifier des clusters, des doublons et des valeurs aberrantes, et pour inspecter comment les divisions ou les classes sont réparties dans tes données. Sélectionne une région du graphique au lasso pour filtrer la galerie sur ces images. Voir Clustering pour plus de détails.
Link to this sectionStatistiques et visualisation#
L'onglet Charts fournit une analyse automatique incluant :
- Distribution des divisions : graphique en anneau du nombre d'images d'entraînement/validation/test
- Classes principales : graphique en anneau des classes d'annotation les plus fréquentes
- Dimensions des images : histogramme de la distribution de la largeur et de la hauteur des images (en pixels)
- Points par instance : distribution du nombre de sommets de polygone ou de points clés (jeux de données de segmentation/pose)
- Emplacements des annotations : carte thermique 2D des positions centrales des boîtes englobantes
- Dimensions des images 2D : carte thermique 2D de la largeur par rapport à la hauteur avec des lignes de guidage de ratio d'aspect
Link to this sectionLiens rapides#
- Jeux de données : téléverse, gère et exporte tes données d'entraînement
- Annotation : étiquette tes données avec des outils manuels et assistés par IA
- Entraînement dans le cloud : entraîne des modèles sur tes jeux de données annotés
- URI de jeu de données : utilise les URI
ul://pour t'entraîner depuis n'importe où
Link to this sectionFAQ#
Link to this sectionQuels formats de fichiers sont pris en charge pour le téléversement ?#
Ultralytics Platform prend en charge :
Images : JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (max 50 Mo chacune)
Vidéos : MP4, WebM, MOV, MKV, M4V (max 1 Go, frames extraites à 1 FPS, max 100 frames)
Fichiers de jeux de données : Archives ZIP ou TAR incluant .tar.gz et .tgz (max 10 Go sur Free, 20 Go sur Pro, 50 Go sur Enterprise) contenant des images avec des étiquettes au format YOLO optionnelles, ainsi que des exportations NDJSON
Link to this sectionQuelle est la taille maximale d'un jeu de données ?#
Les limites de stockage dépendent de ton forfait :
| Forfait | Limite de stockage |
|---|---|
| Gratuit | 100 Go |
| Pro | 500 Go |
| Enterprise | Illimité |
Limites de fichiers individuels : Images 50 Mo, Vidéos 1 Go, jeux de données 10 Go sur Free / 20 Go sur Pro / 50 Go sur Enterprise
Link to this sectionPuis-je utiliser mes jeux de données de la plateforme pour un entraînement local ?#
Oui ! Utilise le format d'URI de jeu de données pour t'entraîner localement :
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Ou exporte ton jeu de données au format NDJSON pour un entraînement totalement hors ligne.