Jeux de données
Les jeux de données de la plateforme Ultralytics offrent une solution rationalisée pour gérer tes données d'entraînement. Après le téléchargement, la plateforme traite automatiquement les images, les étiquettes et les statistiques. Un jeu de données est prêt à être utilisé pour l'entraînement une fois le traitement terminé et s'il contient au moins une image dans la division train, au moins une image dans la division val ou test, au moins une image étiquetée, et un total d'au moins deux images.
Télécharger un jeu de données
La plateforme Ultralytics accepte plusieurs formats de téléchargement pour plus de flexibilité.
Formats pris en charge
| Format | Extensions | Notes | Taille max |
|---|---|---|---|
| JPEG | .jpg, .jpeg | Le plus courant, recommandé | 50 Mo |
| PNG | .png | Prend en charge la transparence | 50 Mo |
| WebP | .webp | Moderne, bonne compression | 50 Mo |
| BMP | .bmp | Non compressé | 50 Mo |
| TIFF | .tiff, .tif | Haute qualité | 50 Mo |
| HEIC | .heic | Photos d'iPhone | 50 Mo |
| AVIF | .avif | Format de nouvelle génération | 50 Mo |
| JP2 | .jp2 | JPEG 2000 | 50 Mo |
| DNG | .dng | Appareil photo brut | 50 Mo |
| MPO | .mpo | Objet multi-images | 50 Mo |
Préparation de ton jeu de données
La plateforme prend en charge les téléchargements Ultralytics YOLO, COCO, Ultralytics NDJSON et bruts (non annotés) :
Utilise la structure de répertoire YOLO standard avec un fichier data.yaml :
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yamlLe fichier YAML définit la configuration de ton jeu de données :
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dogBrut : Télécharge des images non annotées (sans étiquettes). Utile si tu prévois d'annoter directement sur la plateforme en utilisant l'éditeur d'annotation.
Tu peux aussi télécharger des images sans dossiers de division explicites. La plateforme respecte la cible de division active pendant le téléchargement, et pour les jeux de données non classifiés, elle peut automatiquement créer une division de validation à partir d'une partie de l'ensemble d'entraînement lorsqu'aucune information de division n'est fournie. Tu peux toujours réassigner des images plus tard avec le déplacement en masse vers une division ou la redistribution des divisions.
Le format est détecté automatiquement : les jeux de données avec un fichier data.yaml contenant des clés names, train ou val sont traités comme YOLO. Les jeux de données avec des fichiers JSON COCO (contenant des tableaux images, annotations et categories) sont traités comme COCO. Les exportations .ndjson sont importées en tant qu'Ultralytics NDJSON. Les jeux de données contenant uniquement des images sans annotations sont traités comme bruts.
Pour les détails de format spécifiques à une tâche, consulte tâches prises en charge et l'Aperçu des jeux de données.
Processus de téléchargement
- Navigue vers
Datasetsdans la barre latérale - Clique sur
New Datasetou fais glisser des fichiers dans la zone de téléchargement - Sélectionne le type de tâche (voir tâches prises en charge)
- Ajoute un nom et une description optionnelle
- Définis la visibilité (publique ou privée) et une licence optionnelle (voir licences disponibles)
- Clique sur
Create

Après le téléchargement, la plateforme traite tes données via un pipeline à plusieurs étapes :
graph LR
A[Upload] --> B[Validate]
B --> C[Normalize]
C --> D[Thumbnail]
D --> E[Parse Labels]
E --> F[Statistics]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#2196F3,color:#fff
style D fill:#2196F3,color:#fff
style E fill:#2196F3,color:#fff
style F fill:#9C27B0,color:#fff- Validation : Vérifications du format et de la taille
- Normalisation : Les grandes images sont redimensionnées (max 4096px, dimension min 28px)
- Miniatures : Aperçus WebP 256px générés
- Analyse d'étiquettes : Étiquettes au format YOLO et COCO extraites
- Statistiques : Distributions des classes et dimensions des images calculées

Valider avant le téléchargement
Tu peux valider ton jeu de données localement avant de le télécharger :
from ultralytics.data.utils import check_det_dataset
check_det_dataset("path/to/data.yaml")Les images doivent mesurer au moins 28px sur leur côté le plus court. Les images plus petites sont rejetées lors du traitement. Les images mesurant plus de 4096px sur leur côté le plus long sont automatiquement redimensionnées tout en préservant le rapport d'aspect.
Parcourir les images
Visualise tes images de jeu de données dans plusieurs mises en page.
Ouvre le panneau Clustering depuis la barre d'outils de la galerie pour explorer ton jeu de données sous forme de nuage de points 2D interactif.
| Vue | Description |
|---|---|
| Grille | Grille de miniatures avec superpositions d'annotations (par défaut) |
| Compact | Miniatures plus petites pour une analyse rapide |
| Tableau | Liste avec miniature, nom de fichier, dimensions, taille, division, classes et comptages d'étiquettes |

Tri et filtrage
Les images peuvent être triées et filtrées pour une navigation efficace :
| Trier | Description |
|---|---|
| Plus récent / Plus ancien | Ordre de téléchargement / création |
| Nom A-Z / Z-A | Nom de fichier alphabétique |
| Hauteur ↑/↓ | Hauteur de l'image en pixels |
| Largeur ↑/↓ | Largeur de l'image en pixels |
| Taille ↑/↓ | Taille du fichier sur le disque |
| Annotations ↑/↓ | Nombre d'annotations par image |
Pour les datasets de plus de 100 000 images, les tris par nom / taille / largeur / hauteur sont désactivés pour maintenir la réactivité de la galerie. Les tris par les plus récents, les plus anciens et le nombre d'annotations restent disponibles.
Utilise le filtre d'étiquettes réglé sur Unlabeled pour trouver rapidement les images qui ont encore besoin d'être annotées. C'est particulièrement utile pour les grands datasets lorsque tu souhaites suivre la progression de l'étiquetage.
Visionneuse plein écran
Clique sur n'importe quelle image pour ouvrir la visionneuse plein écran avec :
- Navigation : Touches fléchées ou aperçus miniatures pour parcourir
- Métadonnées : Nom de fichier, dimensions, badge de division, nombre d'annotations
- Annotations : Basculer la visibilité de la superposition d'annotations
- Répartition par classe : Nombre d'étiquettes par classe avec indicateurs de couleur
- Modifier : Entre dans le mode annotation pour ajouter ou modifier des étiquettes
- Télécharger : Télécharge le fichier image original
- Supprimer : Supprime l'image du dataset
- Zoom :
Cmd/Ctrl+Scroll,Cmd/Ctrl++ouCmd/Ctrl+=pour zoomer, etCmd/Ctrl+-pour dézoomer - Réinitialiser la vue :
Cmd/Ctrl + 0ou le bouton de réinitialisation pour ajuster l'image à la visionneuse - Déplacement (Pan) : Maintiens
Spaceet fais glisser pour déplacer le canevas lorsque tu es zoomé - Vue en pixels : Active le rendu pixélisé pour une inspection détaillée

Filtrer par division
Filtre les images par leur division de dataset :
| Split | Objectif |
|---|---|
| Entraîner | Utilisé pour l'entraînement du modèle |
| Val | Utilisé pour la validation pendant l'entraînement |
| Test | Utilisé pour l'évaluation finale |
Clustering
Le panneau Clustering projette ton dataset dans un nuage de points 2D interactif où les images visuellement similaires sont regroupées. Utilise-le pour faire ressortir des clusters, repérer des doublons et des valeurs aberrantes, et inspecter comment les divisions ou les classes sont réparties dans tes données — sans quitter la galerie. Ouvre-le depuis l'icône de graphique en nuage dans la barre d'outils de la galerie sur n'importe quelle page de dataset.

Exécution de l'analyse
Démarre une analyse :
- Ouvre un dataset et clique sur l'icône de graphique en nuage dans la barre d'outils de la galerie
- Clique sur
Analyze Dataset - Attends que la barre de progression soit terminée — les résultats apparaissent dans le même panneau
L'analyse s'exécute en arrière-plan et peut prendre quelques minutes selon la taille de ton dataset. Tu peux fermer le panneau ou quitter la page et revenir plus tard.
Visualisation
Une fois l'analyse terminée, le panneau affiche un nuage de points 2D de toutes les images analysées. Les filtres de la galerie (division, classe, annoté/non annoté) estompent les points hors filtre pour que tu puisses te concentrer sur le sous-ensemble qui t'intéresse.

Colorer par
Modifie la façon dont les points de données sont ombrés avec le menu déroulant Color by dans la barre d'outils du panneau. Change de mode de vue à tout moment — le graphique se recolore instantanément pour que tu puisses voir comment les divisions, les classes ou les propriétés des images sont réparties dans tes clusters :
| Option | Ombrage |
|---|---|
| Splits | Train / Val / Test |
| Classes | Première classe d'annotation sur chaque image |
| Width | Largeur de l'image |
| Height | Hauteur de l'image |
| Size | Taille du fichier |
| Annotations | Nombre d'annotations par image |

Sélection au lasso
Dessine une sélection libre autour d'une région pour mettre en évidence les points sur le graphique. La galerie est filtrée pour ne montrer que les images correspondantes, afin que tu puisses les inspecter, les réétiqueter, les déplacer ou les supprimer en utilisant les opérations sur les images habituelles.
Un jeton au-dessus du graphique indique combien de points sont sélectionnés — clique sur × pour effacer le lasso et revenir à la vue complète de la galerie.
Déplacement et Zoom
Navigue dans les grands nuages de points directement avec ta souris et ton clavier :
| Entrée | Action |
|---|---|
| Scroll | Déplace le graphique en 2D |
| Cmd/Ctrl+Scroll | Zoome avant ou arrière, ancré sur le curseur |
| Maintiens Space | Passe en mode glisser-pour-déplacer |
Ré-analyse
Si ton dataset change après l'analyse, un bouton Re-analyze apparaît en haut du panneau pour les propriétaires et les éditeurs.
Clique sur Re-analyze pour recalculer les embeddings et la projection 2D à partir de zéro.
Onglets du jeu de données
Chaque page de dataset peut afficher jusqu'à six onglets, selon l'état du dataset et tes permissions :
Onglet Images
La vue par défaut affichant la galerie d'images avec les superpositions d'annotations. Prend en charge les modes d'affichage en grille, compact et tableau. Fais glisser et dépose des fichiers ici pour ajouter plus d'images.
Onglet Classes
Cet onglet apparaît lorsque le dataset contient des images.
Gère les classes d'annotation pour ton dataset :
- Histogramme de classe : Graphique à barres montrant le nombre d'annotations par classe avec bascule d'échelle linéaire/logarithmique
- Tableau des classes : Tableau triable et interrogeable avec nom de classe, nombre d'étiquettes et nombre d'images
- Modifier les noms de classe : Clique sur n'importe quel nom de classe pour le renommer en ligne
- Modifier les couleurs de classe : Clique sur un échantillon de couleur pour changer la couleur de la classe
- Ajouter une nouvelle classe : Utilise l'entrée en bas pour ajouter des classes

Si ton dataset présente un déséquilibre de classes (par ex. 10 000 annotations "person" mais seulement 50 "bicycle"), utilise la bascule Log Scale sur l'histogramme de classe pour visualiser toutes les classes clairement.
Onglet Graphiques
Cet onglet apparaît lorsque le dataset contient des images.
Statistiques automatiques calculées à partir de ton jeu de données :
| Graphique | Description |
|---|---|
| Répartition des ensembles | Graphique en anneau du nombre d'images d'entraînement/validation/test et du pourcentage étiqueté |
| Classes principales | Graphique en anneau des 10 classes d'annotation les plus fréquentes |
| Largeurs d'image | Histogramme de la répartition des largeurs d'image avec moyenne |
| Hauteurs d'image | Histogramme de la répartition des hauteurs d'image avec moyenne |
| Points par instance | Nombre de sommets de polygone ou de points clés par annotation (segment/pose) |
| Emplacements des annotations | Carte thermique 2D des positions centrales des boîtes englobantes |
| Dimensions de l'image | Carte thermique 2D largeur vs hauteur avec lignes de guidage du rapport d'aspect |

Les statistiques sont mises en cache pendant 5 minutes. Les modifications apportées aux annotations seront prises en compte après l'expiration du cache.
Clique sur le bouton d'agrandissement sur n'importe quelle carte thermique pour l'afficher en mode plein écran. Cela offre une vue plus large et détaillée, utile pour comprendre les modèles spatiaux dans les grands jeux de données.
Onglet Modèles
Affiche tous les modèles entraînés sur ce jeu de données dans un tableau consultable :
| Colonne | Description |
|---|---|
| Nom | Nom du modèle avec lien |
| Projet | Projet parent avec icône |
| Statut | Badge de statut d'entraînement |
| Tâche | Type de tâche YOLO |
| Époques | Meilleure époque / total des époques |
| mAP50-95 | Précision moyenne (mAP) |
| mAP50 | mAP à IoU 0.50 |
| Créé | Date de création |

Onglet Erreurs
Cet onglet n'apparaît que lorsqu'un ou plusieurs fichiers échouent au traitement.
Les images ayant échoué au traitement sont listées ici avec :
- Bannière d'erreur : Nombre total d'images ayant échoué et conseils
- Tableau d'erreurs : Nom du fichier, description de l'erreur conviviale, conseils de résolution et miniature d'aperçu
- Les erreurs courantes incluent les fichiers corrompus, les formats non pris en charge, les images trop petites (min 28px) et les modes couleur non pris en charge

Erreurs de traitement courantes
| Erreur | Cause | Correction |
|---|---|---|
| Impossible de lire le fichier image | Format corrompu ou non pris en charge | Réexporte depuis l'éditeur d'image |
| Incomplet ou corrompu | Le fichier a été tronqué pendant le transfert | Retélécharge le fichier original |
| Image trop petite | Dimension minimale inférieure à 28px | Utilise des images sources de plus haute résolution |
| Mode couleur non pris en charge | Mode couleur CMYK ou indexé | Convertis en mode RVB |
Onglet Versions
Crée des instantanés NDJSON immuables de ton jeu de données pour un entraînement reproductible. Chaque version capture le nombre d'images, de classes, d'annotations et la taille du fichier au moment de la création.
| Colonne | Description |
|---|---|
| Version | Numéro de version (v1, v2, ...) |
| Description | Description fournie par l'utilisateur (modifiable) |
| Images | Nombre d'images au moment de l'instantané |
| Classes | Nombre de classes au moment de l'instantané |
| Annotations | Nombre d'annotations au moment de l'instantané |
| Taille | Taille du fichier d'exportation NDJSON |
| Créé | Quand la version a été créée |
Pour créer une version :
- Ouvre l'onglet Versions
- Entre éventuellement une description (par ex. "Ajout de 500 images d'entraînement" ou "Correction de classes mal étiquetées")
- Clique sur + Nouvelle version
- La nouvelle version apparaît dans le tableau
- Télécharge la version séparément depuis le tableau si nécessaire
Chaque version est numérotée séquentiellement (v1, v2, v3...) et stockée de manière permanente. Tu peux télécharger n'importe quelle version précédente à tout moment depuis le tableau des versions.
La création de version est disponible une fois que le jeu de données atteint le statut ready.
Crée une version avant et après des modifications majeures de ton jeu de données — ajout d'images, correction d'annotations ou rééquilibrage des ensembles. Cela te permet de comparer les performances du modèle selon différents états du jeu de données.
La taille indiquée est celle du fichier d'exportation NDJSON, qui contient les URL des images et les annotations — pas les images elles-mêmes. Les données d'image réelles sont stockées séparément et accessibles via des URL signées.
Exporter le jeu de données
Exporte ton jeu de données pour une utilisation hors ligne avec un téléchargement NDJSON depuis l'en-tête du jeu de données ou l'onglet Versions.
Pour exporter :
- Clique sur le bouton Exporter dans l'en-tête du jeu de données
- Télécharge l'instantané NDJSON actuel directement
- Utilise l'onglet Versions quand tu souhaites un instantané numéroté immuable que tu peux retélécharger plus tard

Le format NDJSON stocke un objet JSON par ligne. La première ligne contient les métadonnées du jeu de données, suivies d'une ligne par image :
{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}Les URL des images dans le NDJSON exporté sont signées et valides pendant 7 jours. Si tu as besoin d'URL fraîches, réexporte le jeu de données ou crée une nouvelle version.
Consulte la documentation du format Ultralytics NDJSON pour la spécification complète.
Opérations sur les images
Actions rapides
Fais un clic droit sur n'importe quelle image dans la vue Grille ou Compacte pour accéder aux actions rapides :
| Action | Description |
|---|---|
| Déplacer vers l'ensemble | Réassigne l'image à une répartition Entraînement, Validation ou Test |
| Télécharger | Télécharge le fichier image original |
| Supprimer | Supprime l'image du dataset |

Le menu contextuel d'image s'applique à une seule image. Pour des opérations groupées sur plusieurs images, utilise la vue Tableau avec la sélection par cases à cocher.
Déplacement groupé vers une répartition
Réassigne les images sélectionnées à une répartition différente au sein du même dataset :
- Passe à la vue Tableau
- Sélectionne les images en utilisant les cases à cocher
- Fais un clic droit pour ouvrir le menu contextuel
- Choisis
Move to split> Train, Validation ou Test
Tu peux aussi faire glisser et déposer les images sur les onglets de filtre de répartition dans la vue en grille.
Charge toutes les images dans un seul dataset, puis utilise le déplacement groupé pour organiser les sous-ensembles en répartitions d'entraînement, de validation et de test.
Redistribution des répartitions
Redistribue toutes les images entre les répartitions d'entraînement, de validation et de test en utilisant des ratios personnalisés :
- Clique sur la barre de répartition dans la barre d'outils du dataset pour ouvrir la boîte de dialogue Redistribute Splits
- Ajuste les pourcentages de répartition en utilisant l'une des méthodes ci-dessous
- Consulte l'aperçu du nombre d'images en direct pour confirmer la distribution
- Clique sur Apply pour réassigner aléatoirement toutes les images selon tes pourcentages

La boîte de dialogue propose trois façons de définir tes ratios de répartition cibles :
| Méthode | Description |
|---|---|
| Glisser | Fais glisser les poignées entre les segments colorés pour ajuster visuellement les limites des répartitions |
| Saisir | Modifie le pourcentage saisi pour n'importe quelle répartition (les deux autres répartitions se rééquilibrent automatiquement proportionnellement) |
| Auto | Un clic pour définir instantanément une répartition 80/20 entraînement/validation avec la répartition de test fixée à 0% |
Un aperçu en direct montre exactement combien d'images atterriront dans chaque répartition avant que tu n'appliques les changements.
Clique sur le bouton Auto pour définir instantanément la répartition recommandée de 80/20 pour l'entraînement/validation. C'est le ratio le plus courant pour l'entraînement.
Suppression groupée
Supprime plusieurs images à la fois :
- Sélectionne les images dans la vue tableau
- Fais un clic droit et choisis
Delete - Confirme la suppression
URI du Dataset
Référence les datasets de la Platform en utilisant le format d'URI ul:// (voir Using Platform Datasets) :
ul://username/datasets/dataset-slug
Utilise cet URI pour entraîner des modèles depuis n'importe où :
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100L'URI ul:// fonctionne depuis n'importe quel environnement :
- Machine locale : Entraîne sur ton matériel, les données sont téléchargées automatiquement
- Google Colab : Accède à tes datasets de la Platform dans des notebooks
- Serveurs distants : Entraîne sur des machines virtuelles cloud avec un accès complet au dataset
Licences disponibles
La Platform prend en charge les licences suivantes pour les datasets :
| Licence | Type |
|---|---|
| Aucune | Aucune licence sélectionnée |
| CC0-1.0 | Domaine public |
| CC-BY-2.5 | Permissive |
| CC-BY-4.0 | Permissive |
| CC-BY-SA-4.0 | Copyleft |
| CC-BY-NC-4.0 | Non-commercial |
| CC-BY-NC-SA-4.0 | Copyleft |
| CC-BY-ND-4.0 | No derivatives |
| CC-BY-NC-ND-4.0 | Non-commercial |
| Apache-2.0 | Permissive |
| MIT | Permissive |
| AGPL-3.0 | Copyleft |
| GPL-3.0 | Copyleft |
| Research-Only | Restricted |
| Autre | Personnalisé |
Lors du clonage d'un dataset avec une licence copyleft (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), le clone hérite de la licence et le sélecteur de licence est verrouillé.
Paramètres de visibilité
Contrôle qui peut voir ton dataset :
| Paramètre | Description |
|---|---|
| Privé | Toi seul peux y accéder |
| Public | Tout le monde peut le voir sur la page Explorer |
La visibilité est définie lors de la création d'un dataset dans la boîte de dialogue New Dataset à l'aide d'un commutateur. Les datasets publics sont visibles sur la page Explore.
Modifier le dataset
Les métadonnées du dataset sont modifiées en ligne directement sur la page du dataset — aucune boîte de dialogue nécessaire :
- Nom : Clique sur le nom du dataset pour le modifier. Les changements sont enregistrés automatiquement lors de la perte du focus ou en appuyant sur
Enter. - Description : Clique sur la description (ou l'espace réservé "Add a description...") pour modifier. Les changements sont enregistrés automatiquement.
- Type de tâche : Clique sur le badge de tâche pour sélectionner un type de tâche différent.
- Licence : Clique sur le sélecteur de licence pour changer la licence du dataset.
Chaque image stocke les annotations pour tous les types de tâches ensemble. Changer le type de tâche du dataset contrôle quelles annotations sont visibles dans l'éditeur et incluses dans les exportations et l'entraînement. Les annotations pour les autres types de tâches sont conservées dans la base de données et réapparaissent lorsque tu reviens en arrière.
Cloner le dataset
Lorsque tu consultes un dataset public dont tu n'es pas propriétaire, clique sur Clone Dataset pour en créer une copie dans ton espace de travail. Le clone inclut toutes les images, annotations et définitions de classes. Si le dataset original a une licence copyleft, le clone en hérite et le sélecteur de licence est verrouillé.
Mettre en favori et Partager
- Mettre en favori : Clique sur le bouton étoile pour mettre un dataset en favori. Le nombre de favoris est visible par tous les utilisateurs.
- Partager : Pour les datasets publics, clique sur le bouton partager pour copier un lien ou partager sur les réseaux sociaux.
Supprimer le dataset
Supprime un dataset dont tu n'as plus besoin :
- Ouvre le menu d'actions du dataset
- Clique sur
Delete - Confirme dans la boîte de dialogue : "This will move [name] to trash. You can restore it within 30 days."
Deleted datasets are moved to Trash — not permanently deleted. You can restore them within 30 days from Settings > Trash.
Entraîner sur un jeu de données
Lance l'entraînement directement depuis ton jeu de données :
- Click
New Modelon the dataset page - Sélectionne un projet ou crées-en un nouveau
- Configure les paramètres d'entraînement
- Démarre l'entraînement
graph LR
A[Dataset] --> B[New Model]
B --> C[Select Project]
C --> D[Configure]
D --> E[Start Training]
style A fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fffConsulte Entraînement dans le cloud pour plus de détails.
FAQ
Qu'advient-il de mes données après le téléchargement ?
Tes données sont traitées et stockées dans la région que tu as sélectionnée (US, EU ou AP). Les images sont :
- Validées pour leur format et leur taille
- Rejetées si la dimension minimale est inférieure à 28px
- Normalisées si elles dépassent 4096px (en préservant le rapport hauteur/largeur ; encodées pour un stockage optimisé)
- Stockées en utilisant le stockage adressable par contenu (CAS) avec un hachage XXH3-128
- Miniatures générées en 256px WebP pour une navigation rapide
Comment fonctionne le stockage ?
La plateforme Ultralytics utilise le stockage adressable par contenu (CAS) pour un stockage efficace :
- Dédoublonnage : les images identiques téléchargées par différents utilisateurs ne sont stockées qu'une seule fois
- Intégrité : le hachage XXH3-128 garantit l'intégrité des données
- Efficacité : réduit les coûts de stockage et accélère le traitement
- Régional : tes données restent dans la région sélectionnée (US, EU ou AP)
Puis-je ajouter des images à un jeu de données existant ?
Oui, fais glisser et dépose tes fichiers sur la page du jeu de données ou utilise le bouton de téléchargement pour ajouter des images supplémentaires. De nouvelles statistiques seront calculées automatiquement.
Comment déplacer des images entre les jeux de données ?
Utilise la fonctionnalité de déplacement en masse vers un jeu :
- Sélectionne les images dans la vue tableau
- Right-click and choose
Move to split - Sélectionne le jeu cible (Entraînement, Validation ou Test)
Quels formats d'étiquettes sont pris en charge ?
La plateforme Ultralytics prend en charge les étiquettes YOLO, COCO JSON, Ultralytics NDJSON et les téléchargements d'images brutes :
Un fichier .txt par image avec des coordonnées normalisées (plage 0-1) :
| Tâche | Format | Exemple |
|---|---|---|
| Detect | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| Segment | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| Pose | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| Classify | Structure des répertoires | train/cats/, train/dogs/ |
Drapeaux de visibilité de pose : 0=non étiqueté, 1=étiqueté mais occlus, 2=étiqueté et visible.
Puis-je annoter le même jeu de données pour plusieurs types de tâches ?
Oui. Chaque image stocke les annotations pour les 5 types de tâches (détection, segmentation, pose, OBB, classification) ensemble. Tu peux changer le type de tâche actif du jeu de données à tout moment sans perdre les annotations existantes. Seules les annotations correspondant au type de tâche actif sont affichées dans l'éditeur et incluses dans les exportations et l'entraînement — les annotations pour les autres tâches sont conservées et réapparaissent lorsque tu changes de nouveau.