Passer au contenu

Préparation des données

La préparation des données est le fondement des modèles de vision par ordinateur réussis. La plateforme Ultralytics fournit des outils complets pour gérer vos données d'entraînement, du téléversement à l'analyse, en passant par l'annotation.

Aperçu

La section Données de la plateforme Ultralytics vous aide à :

  • Télécharger des images, des vidéos et des archives (ZIP, TAR, GZ)
  • Annoter à l'aide d'outils de dessin manuels et d'étiquetage intelligent SAM
  • Analyser vos données avec des statistiques et des visualisations
  • Exportation au format NDJSON pour la formation locale

Aperçu des données Ultralytics Encadré Ensembles de données

Flux de travail

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ÉtapeDescription
TéléversementImportez des images, des vidéos ou des archives avec traitement automatique
AnnotationÉtiqueter les données avec des boîtes englobantes, des polygones, des points clés ou des classifications
AnalyseVisualiser les distributions de classes, les cartes thermiques spatiales et les statistiques de dimensions
ExporterTélécharger au format NDJSON pour une utilisation hors ligne

Tâches prises en charge

La plateforme Ultralytics prend en charge les 5 types de tâches YOLO :

TâcheDescriptionOutil d'annotation
DétecterDétection d'objets avec des boîtes englobantesOutil rectangle
SegmenterSegmentation d'instances avec des masques de pixelsOutil polygone
PoseEstimation de points clés (format COCO à 17 points)Outil de points clés
OBBBoîtes englobantes orientées pour les objets en rotationOutil de boîtes orientées
ClassifierClassification au niveau de l'imageSélecteur de classe

Sélection du type de tâche

Le type de tâche est défini lors de la création d'un ensemble de données et détermine les outils d'annotation disponibles. Vous pouvez le modifier ultérieurement à partir des paramètres de l'ensemble de données, mais les annotations incompatibles ne s'afficheront plus après le changement.

Principales caractéristiques

Stockage intelligent

Ultralytics utilise le stockage adressable par contenu (CAS) pour une gestion efficace des données :

  • Déduplication: images identiques stockées une seule fois via le hachage XXH3-128
  • Intégrité: l'adressage basé sur le hachage garantit l'intégrité des données.
  • Efficacité : Stockage optimisé et traitement rapide

URI de jeux de données

Référencer des jeux de données en utilisant le ul:// Format URI (voir Utilisation des jeux de données de la plateforme) :

yolo train data=ul://username/datasets/my-dataset

Cela permet de s'entraîner sur les ensembles de données de la plateforme à partir de n'importe quelle machine sur laquelle votre clé API est configurée.

Utiliser les données de la plateforme depuis Python

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Onglets des ensembles de données

Chaque page de jeu de données comporte cinq onglets :

OngletDescription
ImagesParcourez les images en mode grille, compact ou tableau avec des annotations superposées.
CoursAfficher et modifier les noms des classes, les couleurs et le nombre d'étiquettes par classe
GraphiquesStatistiques automatiques : distribution fractionnée, nombre de classes, cartes thermiques
ModèlesModèles entraînés sur cet ensemble de données avec métriques et statut
ErreursImages dont le traitement a échoué, avec détails de l'erreur et conseils pour la résoudre

Statistiques et visualisation

L'argument Charts L'onglet fournit une analyse automatique comprenant :

  • Répartition fractionnée: graphique en anneau représentant le nombre d'images train/val/test
  • Classes principales: graphique en anneau des classes d'annotation les plus fréquentes
  • Largeurs d'image: histogramme de la distribution des largeurs d'image
  • Hauteurs d'image: histogramme de la distribution des hauteurs d'image
  • Points par instance: distribution du nombre de sommets de polygones ou de points clés (ensembles de donnéessegment)
  • Emplacements des annotations: carte thermique 2D des positions centrales des cadres de sélection
  • Dimensions de l'image: carte thermique 2D de la largeur par rapport à la hauteur avec lignes de guidage du rapport d'aspect
  • Jeux de données : Téléchargez et gérez vos données d'entraînement
  • Annotation : Étiquetage des données avec des outils manuels et assistés par l'IA

FAQ

Quels formats de fichier sont pris en charge pour le téléversement ?

La plateforme Ultralytics prend en charge :

Images : JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (50 Mo maximum chacune)

Vidéos : MP4, WebM, MOV, AVI, MKV, M4V (max. 1 Go, images extraites à 1 image par seconde, max. 100 images)

Archives : ZIP, TAR, TAR.GZ, TGZ, GZ (max. 10 Go) contenant des images avec des étiquettesYOLO en option

Quelle est la taille maximale d'un jeu de données ?

Les limites de stockage dépendent de votre plan :

ForfaitLimite de stockage
Gratuit100 Go
Pro500 Go
EntreprisePersonnalisé

Limites individuelles par fichier : images 50 Mo, vidéos 1 Go, archives 10 Go

Puis-je utiliser mes jeux de données de la Plateforme pour l'entraînement local ?

Oui ! Utilisez le format URI du jeu de données pour l'entraînement local :

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Ou exportez votre ensemble de données au format NDJSON pour une formation entièrement hors ligne.



📅 Créé il y a 1 mois ✏️ Mis à jour il y a 5 jours
glenn-jochersergiuwaxmann

Commentaires