Préparation des données
La préparation des données est le fondement des modèles de vision par ordinateur réussis. La plateforme Ultralytics fournit des outils complets pour gérer vos données d'entraînement, du téléversement à l'analyse, en passant par l'annotation.
Aperçu
La section Données de la plateforme Ultralytics vous aide à :
- Téléverser des images, des vidéos et des archives ZIP
- Annoter avec des outils manuels et un étiquetage assisté par l'IA
- Analyser vos données avec des statistiques et des visualisations
- Exporter dans des formats standards pour l'entraînement local
Flux de travail
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Étape | Description |
|---|---|
| Téléversement | Importer des images, des vidéos ou des archives ZIP avec traitement automatique |
| Annotation | Étiqueter les données avec des boîtes englobantes, des polygones, des points clés ou des classifications |
| Analyse | Visualiser les distributions de classes, les cartes thermiques spatiales et les statistiques de dimensions |
| Exporter | Télécharger au format NDJSON pour une utilisation hors ligne |
Tâches prises en charge
La plateforme Ultralytics prend en charge les 5 types de tâches YOLO :
| Tâche | Description | Outil d'annotation |
|---|---|---|
| Détecter | Détection d'objets avec des boîtes englobantes | Outil rectangle |
| Segmenter | Segmentation d'instances avec des masques de pixels | Outil polygone |
| Pose | Estimation de points clés (format COCO à 17 points) | Outil de points clés |
| OBB | Boîtes englobantes orientées pour les objets en rotation | Outil de boîtes orientées |
| Classifier | Classification au niveau de l'image | Sélecteur de classe |
Principales caractéristiques
Stockage intelligent
La plateforme Ultralytics utilise une technologie de stockage efficace :
- Déduplication : Les images identiques ne sont stockées qu'une seule fois
- Intégrité : Les sommes de contrôle garantissent l'intégrité des données
- Efficacité : Stockage optimisé et traitement rapide
URI de jeux de données
Référencer des jeux de données en utilisant le ul:// format URI :
yolo train data=ul://username/datasets/my-dataset
Cela permet l'entraînement sur les jeux de données de la Plateforme depuis n'importe quelle machine avec votre clé API configurée.
Statistiques et visualisation
Chaque jeu de données inclut des statistiques automatiques :
- Distribution des classes : Diagramme à barres du nombre d'étiquettes par classe
- Carte thermique de localisation : Distribution spatiale des annotations
- Analyse des dimensions : Distribution de la largeur par rapport à la hauteur de l'image
- Répartition des ensembles : Nombre d'échantillons d'entraînement/validation/test
Liens rapides
- Jeux de données : Téléchargez et gérez vos données d'entraînement
- Annotation : Étiquetage des données avec des outils manuels et assistés par l'IA
FAQ
Quels formats de fichier sont pris en charge pour le téléversement ?
La plateforme Ultralytics prend en charge :
Images : JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (50 Mo maximum chacune)
Vidéos : MP4, WebM, MOV, AVI, MKV, M4V (max. 1 Go, images extraites à 1 image par seconde, max. 100 images)
Archives : fichiers ZIP (max. 50 Go) contenant des images avec des étiquettes YOLO facultatives.
Quelle est la taille maximale d'un jeu de données ?
Les limites de stockage dépendent de votre plan :
| Forfait | Limite de stockage |
|---|---|
| Gratuit | 100 Go |
| Pro | 500 Go |
| Entreprise | Personnalisé |
Limites individuelles par fichier : images 50 Mo, vidéos 1 Go, archives ZIP 50 Go
Puis-je utiliser mes jeux de données de la Plateforme pour l'entraînement local ?
Oui ! Utilisez le format URI du jeu de données pour l'entraînement local :
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
Ou exportez votre jeu de données au format NDJSON pour un entraînement entièrement hors ligne.