Passer au contenu

Préparation des données

La préparation des données est le fondement des modèles de vision par ordinateur réussis. La plateforme Ultralytics fournit des outils complets pour gérer vos données d'entraînement, du téléversement à l'analyse, en passant par l'annotation.

Aperçu

La section Données de la plateforme Ultralytics vous aide à :

  • Téléverser des images, des vidéos et des archives ZIP
  • Annoter avec des outils manuels et un étiquetage assisté par l'IA
  • Analyser vos données avec des statistiques et des visualisations
  • Exporter dans des formats standards pour l'entraînement local

Flux de travail

graph LR
    A[📤 Upload] --> B[🏷️ Annotate]
    B --> C[📊 Analyze]
    C --> D[🚀 Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ÉtapeDescription
TéléversementImporter des images, des vidéos ou des archives ZIP avec traitement automatique
AnnotationÉtiqueter les données avec des boîtes englobantes, des polygones, des points clés ou des classifications
AnalyseVisualiser les distributions de classes, les cartes thermiques spatiales et les statistiques de dimensions
ExporterTélécharger au format NDJSON pour une utilisation hors ligne

Tâches prises en charge

La plateforme Ultralytics prend en charge les 5 types de tâches YOLO :

TâcheDescriptionOutil d'annotation
DétecterDétection d'objets avec des boîtes englobantesOutil rectangle
SegmenterSegmentation d'instances avec des masques de pixelsOutil polygone
PoseEstimation de points clés (format COCO à 17 points)Outil de points clés
OBBBoîtes englobantes orientées pour les objets en rotationOutil de boîtes orientées
ClassifierClassification au niveau de l'imageSélecteur de classe

Principales caractéristiques

Stockage intelligent

La plateforme Ultralytics utilise une technologie de stockage efficace :

  • Déduplication : Les images identiques ne sont stockées qu'une seule fois
  • Intégrité : Les sommes de contrôle garantissent l'intégrité des données
  • Efficacité : Stockage optimisé et traitement rapide

URI de jeux de données

Référencer des jeux de données en utilisant le ul:// format URI :

yolo train data=ul://username/datasets/my-dataset

Cela permet l'entraînement sur les jeux de données de la Plateforme depuis n'importe quelle machine avec votre clé API configurée.

Statistiques et visualisation

Chaque jeu de données inclut des statistiques automatiques :

  • Distribution des classes : Diagramme à barres du nombre d'étiquettes par classe
  • Carte thermique de localisation : Distribution spatiale des annotations
  • Analyse des dimensions : Distribution de la largeur par rapport à la hauteur de l'image
  • Répartition des ensembles : Nombre d'échantillons d'entraînement/validation/test
  • Jeux de données : Téléchargez et gérez vos données d'entraînement
  • Annotation : Étiquetage des données avec des outils manuels et assistés par l'IA

FAQ

Quels formats de fichier sont pris en charge pour le téléversement ?

La plateforme Ultralytics prend en charge :

Images : JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (50 Mo maximum chacune)

Vidéos : MP4, WebM, MOV, AVI, MKV, M4V (max. 1 Go, images extraites à 1 image par seconde, max. 100 images)

Archives : fichiers ZIP (max. 50 Go) contenant des images avec des étiquettes YOLO facultatives.

Quelle est la taille maximale d'un jeu de données ?

Les limites de stockage dépendent de votre plan :

ForfaitLimite de stockage
Gratuit100 Go
Pro500 Go
EntreprisePersonnalisé

Limites individuelles par fichier : images 50 Mo, vidéos 1 Go, archives ZIP 50 Go

Puis-je utiliser mes jeux de données de la Plateforme pour l'entraînement local ?

Oui ! Utilisez le format URI du jeu de données pour l'entraînement local :

export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100

Ou exportez votre jeu de données au format NDJSON pour un entraînement entièrement hors ligne.



📅 Créé il y a 20 jours ✏️ Mis à jour il y a 12 jours
glenn-jocher

Commentaires