Préparation des données

La préparation des données est la base de modèles de vision par ordinateur performants. Ultralytics Platform propose des outils complets pour gérer tes données d'entraînement, du téléchargement à l'analyse, en passant par l'annotation.



Watch: Get Started with Ultralytics Platform - Data

Présentation

La section Données de Ultralytics Platform t'aide à :

  • Télécharger des images, des vidéos et des fichiers de jeux de données (ZIP, TAR incluant .tar.gz/.tgz, NDJSON)
  • Annoter avec des outils de dessin manuel et un étiquetage intelligent alimenté par SAM — choisis entre SAM 2.1 ou le nouveau SAM 3
  • Analyser tes données avec des statistiques et des visualisations
  • Exporter au format NDJSON pour un entraînement local

Aperçu de la barre latérale des jeux de données dans Ultralytics Platform

Flux de travail

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ÉtapeDescription
TéléchargerImporte des images, des vidéos ou des archives avec un traitement automatique
AnnoterÉtiquette tes données avec des outils manuels pour les 5 types de tâches, ou utilise l'annotation SAM pour la détection, la segmentation et l'OBB
AnalyserVisualise les distributions des classes, les cartes thermiques spatiales et les statistiques de dimension
ExporterTélécharge au format NDJSON pour une utilisation hors ligne

Tâches prises en charge

Ultralytics Platform prend en charge les 5 types de tâches YOLO :

TâcheDescriptionOutil d'annotation
DétectionDétection d'objets avec des boîtes englobantes (bounding boxes)Outil rectangle
SegmentationSegmentation d'instance avec des masques de pixelsOutil polygone
PoseEstimation de points clés avec des modèles de squelette intégrés et personnalisésOutil de points clés
OBBBoîtes englobantes orientées pour les objets en rotationOutil de boîte orientée
ClassificationClassification au niveau de l'imageSélecteur de classe
Sélection du type de tâche

Le type de tâche est défini lors de la création d'un jeu de données et détermine quels outils d'annotation sont disponibles. Tu peux le modifier ultérieurement depuis le sélecteur de tâche dans l'en-tête du jeu de données, mais les annotations incompatibles ne seront plus affichées après le changement.

Fonctionnalités clés

Stockage intelligent

Ultralytics Platform utilise le stockage à adressage par contenu (CAS) pour une gestion efficace des données :

  • Déduplication : Les images identiques ne sont stockées qu'une seule fois via le hachage XXH3-128
  • Intégrité : L'adressage basé sur le hachage garantit l'intégrité des données
  • Efficacité : Stockage optimisé et traitement rapide

URI de jeu de données

Référence tes jeux de données en utilisant le format d'URI ul:// (voir Utiliser les jeux de données de la plateforme) :

yolo train data=ul://username/datasets/my-dataset

Cela te permet de t'entraîner sur les jeux de données de la plateforme depuis n'importe quelle machine avec ta clé API configurée.

Utiliser les données de la plateforme depuis Python
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Gestion des versions des jeux de données

Crée des instantanés NDJSON immuables de ton jeu de données pour un entraînement reproductible. Chaque version capture le nombre d'images, de classes et d'annotations au moment de la création. Voir l'onglet Versions pour plus de détails.

Onglets du jeu de données

Les pages de jeux de données peuvent afficher jusqu'à six onglets, selon l'état du jeu de données et tes autorisations :

OngletDescription
ImagesParcours les images en vue grille, compacte ou tableau avec des superpositions d'annotations
ClassesAffiche et modifie les noms des classes, les couleurs et le nombre d'étiquettes par classe
GraphiquesStatistiques automatiques : distribution des divisions, décomptes des classes, cartes thermiques
ModèlesModèles entraînés sur ce jeu de données avec des métriques et un état
VersionsCrée et télécharge des instantanés NDJSON immuables pour un entraînement reproductible
ErreursImages ayant échoué au traitement avec des détails sur les erreurs et des conseils de correction

Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.

Clustering

Explore ton jeu de données sous forme de nuage de points 2D interactif où les images visuellement similaires sont regroupées — utile pour faire ressortir des clusters, des doublons et des valeurs aberrantes, et pour inspecter la répartition des divisions ou des classes dans tes données. Utilise le lasso sur une zone du tracé pour filtrer la galerie sur ces images. Voir Clustering pour plus de détails.

Statistiques et visualisation

The Charts tab provides automatic analysis including:

  • Distribution des divisions : Graphique en anneau du nombre d'images d'entraînement/validation/test
  • Classes principales : Graphique en anneau des classes d'annotation les plus fréquentes
  • Largeurs d'image : Histogramme de la distribution de la largeur des images
  • Hauteurs d'image : Histogramme de la distribution de la hauteur des images
  • Points par instance : Distribution du nombre de sommets de polygone ou de points clés (jeux de données segment/pose)
  • Emplacements des annotations : Carte thermique 2D des positions centrales des boîtes englobantes
  • Dimensions de l'image : Carte thermique 2D de la largeur par rapport à la hauteur avec des lignes de guidage pour le rapport hauteur/largeur

Liens rapides

FAQ

Quels formats de fichier sont pris en charge pour le téléchargement ?

Ultralytics Platform prend en charge :

Images : JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (50 Mo max chacune)

Vidéos : MP4, WebM, MOV, AVI, MKV, M4V (1 Go max, images extraites à 1 FPS, 100 images max)

Fichiers de jeu de données : Archives ZIP ou TAR incluant .tar.gz et .tgz (10 Go max sur Free, 20 Go sur Pro, 50 Go sur Enterprise) contenant des images avec des étiquettes au format YOLO optionnelles, plus des exportations NDJSON

Quelle est la taille maximale du jeu de données ?

Les limites de stockage dépendent de ton plan :

PlanLimite de stockage
Gratuit100 Go
Pro500 Go
EntrepriseIllimité

Limites par fichier : Images 50 Mo, Vidéos 1 Go, jeux de données 10 Go sur Free / 20 Go sur Pro / 50 Go sur Enterprise

Puis-je utiliser mes jeux de données de la plateforme pour un entraînement local ?

Oui ! Utilise le format d'URI du jeu de données pour t'entraîner localement :

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Ou exporte ton jeu de données au format NDJSON pour un entraînement entièrement hors ligne.

Commentaires