Jeux de données

Les jeux de données de la plateforme Ultralytics offrent une solution rationalisée pour gérer tes données d'entraînement. Après le téléchargement, la plateforme traite automatiquement les images, les étiquettes et les statistiques. Un jeu de données est prêt à être utilisé pour l'entraînement une fois le traitement terminé et s'il contient au moins une image dans la division train, au moins une image dans la division val ou test, au moins une image étiquetée, et un total d'au moins deux images.

Télécharger un jeu de données

La plateforme Ultralytics accepte plusieurs formats de téléchargement pour plus de flexibilité.

Formats pris en charge

FormatExtensionsNotesTaille max
JPEG.jpg, .jpegLe plus courant, recommandé50 Mo
PNG.pngPrend en charge la transparence50 Mo
WebP.webpModerne, bonne compression50 Mo
BMP.bmpNon compressé50 Mo
TIFF.tiff, .tifHaute qualité50 Mo
HEIC.heicPhotos d'iPhone50 Mo
AVIF.avifFormat de nouvelle génération50 Mo
JP2.jp2JPEG 200050 Mo
DNG.dngAppareil photo brut50 Mo
MPO.mpoObjet multi-images50 Mo

Préparation de ton jeu de données

La plateforme prend en charge les téléchargements Ultralytics YOLO, COCO, Ultralytics NDJSON et bruts (non annotés) :

Utilise la structure de répertoire YOLO standard avec un fichier data.yaml :

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Le fichier YAML définit la configuration de ton jeu de données :

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog
Téléchargements bruts

Brut : Télécharge des images non annotées (sans étiquettes). Utile si tu prévois d'annoter directement sur la plateforme en utilisant l'éditeur d'annotation.

Structure de répertoire plate

Tu peux aussi télécharger des images sans dossiers de division explicites. La plateforme respecte la cible de division active pendant le téléchargement, et pour les jeux de données non classifiés, elle peut automatiquement créer une division de validation à partir d'une partie de l'ensemble d'entraînement lorsqu'aucune information de division n'est fournie. Tu peux toujours réassigner des images plus tard avec le déplacement en masse vers une division ou la redistribution des divisions.

Détection automatique de format

Le format est détecté automatiquement : les jeux de données avec un fichier data.yaml contenant des clés names, train ou val sont traités comme YOLO. Les jeux de données avec des fichiers JSON COCO (contenant des tableaux images, annotations et categories) sont traités comme COCO. Les exportations .ndjson sont importées en tant qu'Ultralytics NDJSON. Les jeux de données contenant uniquement des images sans annotations sont traités comme bruts.

Pour les détails de format spécifiques à une tâche, consulte tâches prises en charge et l'Aperçu des jeux de données.

Processus de téléchargement

  1. Navigue vers Datasets dans la barre latérale
  2. Clique sur New Dataset ou fais glisser des fichiers dans la zone de téléchargement
  3. Sélectionne le type de tâche (voir tâches prises en charge)
  4. Ajoute un nom et une description optionnelle
  5. Définis la visibilité (publique ou privée) et une licence optionnelle (voir licences disponibles)
  6. Clique sur Create

Sélecteur de tâche de la boîte de dialogue de téléchargement des jeux de données de la plateforme Ultralytics

Après le téléchargement, la plateforme traite tes données via un pipeline à plusieurs étapes :

graph LR
    A[Upload] --> B[Validate]
    B --> C[Normalize]
    C --> D[Thumbnail]
    D --> E[Parse Labels]
    E --> F[Statistics]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#2196F3,color:#fff
    style D fill:#2196F3,color:#fff
    style E fill:#2196F3,color:#fff
    style F fill:#9C27B0,color:#fff
  1. Validation : Vérifications du format et de la taille
  2. Normalisation : Les grandes images sont redimensionnées (max 4096px, dimension min 28px)
  3. Miniatures : Aperçus WebP 256px générés
  4. Analyse d'étiquettes : Étiquettes au format YOLO et COCO extraites
  5. Statistiques : Distributions des classes et dimensions des images calculées

Barre de progression du téléchargement des jeux de données de la plateforme Ultralytics

Valider avant le téléchargement

Tu peux valider ton jeu de données localement avant de le télécharger :

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")
Exigences de taille d'image

Les images doivent mesurer au moins 28px sur leur côté le plus court. Les images plus petites sont rejetées lors du traitement. Les images mesurant plus de 4096px sur leur côté le plus long sont automatiquement redimensionnées tout en préservant le rapport d'aspect.

Parcourir les images

Visualise tes images de jeu de données dans plusieurs mises en page.

Ouvre le panneau Clustering depuis la barre d'outils de la galerie pour explorer ton jeu de données sous forme de nuage de points 2D interactif.

VueDescription
GrilleGrille de miniatures avec superpositions d'annotations (par défaut)
CompactMiniatures plus petites pour une analyse rapide
TableauListe avec miniature, nom de fichier, dimensions, taille, division, classes et comptages d'étiquettes

Vue en grille de la galerie de jeux de données de la plateforme Ultralytics avec annotations

Tri et filtrage

Les images peuvent être triées et filtrées pour une navigation efficace :

TrierDescription
Plus récent / Plus ancienOrdre de téléchargement / création
Nom A-Z / Z-ANom de fichier alphabétique
Hauteur ↑/↓Hauteur de l'image en pixels
Largeur ↑/↓Largeur de l'image en pixels
Taille ↑/↓Taille du fichier sur le disque
Annotations ↑/↓Nombre d'annotations par image
Grands datasets

Pour les datasets de plus de 100 000 images, les tris par nom / taille / largeur / hauteur sont désactivés pour maintenir la réactivité de la galerie. Les tris par les plus récents, les plus anciens et le nombre d'annotations restent disponibles.

Trouver des images non annotées

Utilise le filtre d'étiquettes réglé sur Unlabeled pour trouver rapidement les images qui ont encore besoin d'être annotées. C'est particulièrement utile pour les grands datasets lorsque tu souhaites suivre la progression de l'étiquetage.

Visionneuse plein écran

Clique sur n'importe quelle image pour ouvrir la visionneuse plein écran avec :

  • Navigation : Touches fléchées ou aperçus miniatures pour parcourir
  • Métadonnées : Nom de fichier, dimensions, badge de division, nombre d'annotations
  • Annotations : Basculer la visibilité de la superposition d'annotations
  • Répartition par classe : Nombre d'étiquettes par classe avec indicateurs de couleur
  • Modifier : Entre dans le mode annotation pour ajouter ou modifier des étiquettes
  • Télécharger : Télécharge le fichier image original
  • Supprimer : Supprime l'image du dataset
  • Zoom : Cmd/Ctrl+Scroll, Cmd/Ctrl++ ou Cmd/Ctrl+= pour zoomer, et Cmd/Ctrl+- pour dézoomer
  • Réinitialiser la vue : Cmd/Ctrl + 0 ou le bouton de réinitialisation pour ajuster l'image à la visionneuse
  • Déplacement (Pan) : Maintiens Space et fais glisser pour déplacer le canevas lorsque tu es zoomé
  • Vue en pixels : Active le rendu pixélisé pour une inspection détaillée

Visionneuse plein écran des datasets de la plateforme Ultralytics avec panneau de métadonnées

Filtrer par division

Filtre les images par leur division de dataset :

SplitObjectif
EntraînerUtilisé pour l'entraînement du modèle
ValUtilisé pour la validation pendant l'entraînement
TestUtilisé pour l'évaluation finale

Clustering

Le panneau Clustering projette ton dataset dans un nuage de points 2D interactif où les images visuellement similaires sont regroupées. Utilise-le pour faire ressortir des clusters, repérer des doublons et des valeurs aberrantes, et inspecter comment les divisions ou les classes sont réparties dans tes données — sans quitter la galerie. Ouvre-le depuis l'icône de graphique en nuage dans la barre d'outils de la galerie sur n'importe quelle page de dataset.

État vide du Clustering des datasets de la plateforme Ultralytics

Exécution de l'analyse

Démarre une analyse :

  1. Ouvre un dataset et clique sur l'icône de graphique en nuage dans la barre d'outils de la galerie
  2. Clique sur Analyze Dataset
  3. Attends que la barre de progression soit terminée — les résultats apparaissent dans le même panneau

L'analyse s'exécute en arrière-plan et peut prendre quelques minutes selon la taille de ton dataset. Tu peux fermer le panneau ou quitter la page et revenir plus tard.

Visualisation

Une fois l'analyse terminée, le panneau affiche un nuage de points 2D de toutes les images analysées. Les filtres de la galerie (division, classe, annoté/non annoté) estompent les points hors filtre pour que tu puisses te concentrer sur le sous-ensemble qui t'intéresse.

Nuage de points du Clustering des datasets de la plateforme Ultralytics

Colorer par

Modifie la façon dont les points de données sont ombrés avec le menu déroulant Color by dans la barre d'outils du panneau. Change de mode de vue à tout moment — le graphique se recolore instantanément pour que tu puisses voir comment les divisions, les classes ou les propriétés des images sont réparties dans tes clusters :

OptionOmbrage
SplitsTrain / Val / Test
ClassesPremière classe d'annotation sur chaque image
WidthLargeur de l'image
HeightHauteur de l'image
SizeTaille du fichier
AnnotationsNombre d'annotations par image

Modes de couleur du Clustering des datasets de la plateforme Ultralytics

Sélection au lasso

Dessine une sélection libre autour d'une région pour mettre en évidence les points sur le graphique. La galerie est filtrée pour ne montrer que les images correspondantes, afin que tu puisses les inspecter, les réétiqueter, les déplacer ou les supprimer en utilisant les opérations sur les images habituelles.

Effacer la sélection

Un jeton au-dessus du graphique indique combien de points sont sélectionnés — clique sur × pour effacer le lasso et revenir à la vue complète de la galerie.

Déplacement et Zoom

Navigue dans les grands nuages de points directement avec ta souris et ton clavier :

EntréeAction
ScrollDéplace le graphique en 2D
Cmd/Ctrl+ScrollZoome avant ou arrière, ancré sur le curseur
Maintiens SpacePasse en mode glisser-pour-déplacer

Ré-analyse

Si ton dataset change après l'analyse, un bouton Re-analyze apparaît en haut du panneau pour les propriétaires et les éditeurs.

Clique sur Re-analyze pour recalculer les embeddings et la projection 2D à partir de zéro.

Onglets du jeu de données

Chaque page de dataset peut afficher jusqu'à six onglets, selon l'état du dataset et tes permissions :

Onglet Images

La vue par défaut affichant la galerie d'images avec les superpositions d'annotations. Prend en charge les modes d'affichage en grille, compact et tableau. Fais glisser et dépose des fichiers ici pour ajouter plus d'images.

Onglet Classes

Cet onglet apparaît lorsque le dataset contient des images.

Gère les classes d'annotation pour ton dataset :

  • Histogramme de classe : Graphique à barres montrant le nombre d'annotations par classe avec bascule d'échelle linéaire/logarithmique
  • Tableau des classes : Tableau triable et interrogeable avec nom de classe, nombre d'étiquettes et nombre d'images
  • Modifier les noms de classe : Clique sur n'importe quel nom de classe pour le renommer en ligne
  • Modifier les couleurs de classe : Clique sur un échantillon de couleur pour changer la couleur de la classe
  • Ajouter une nouvelle classe : Utilise l'entrée en bas pour ajouter des classes

Histogramme et tableau de l'onglet Classes des datasets de la plateforme Ultralytics

Échelle logarithmique pour les datasets déséquilibrés

Si ton dataset présente un déséquilibre de classes (par ex. 10 000 annotations "person" mais seulement 50 "bicycle"), utilise la bascule Log Scale sur l'histogramme de classe pour visualiser toutes les classes clairement.

Onglet Graphiques

Cet onglet apparaît lorsque le dataset contient des images.

Statistiques automatiques calculées à partir de ton jeu de données :

GraphiqueDescription
Répartition des ensemblesGraphique en anneau du nombre d'images d'entraînement/validation/test et du pourcentage étiqueté
Classes principalesGraphique en anneau des 10 classes d'annotation les plus fréquentes
Largeurs d'imageHistogramme de la répartition des largeurs d'image avec moyenne
Hauteurs d'imageHistogramme de la répartition des hauteurs d'image avec moyenne
Points par instanceNombre de sommets de polygone ou de points clés par annotation (segment/pose)
Emplacements des annotationsCarte thermique 2D des positions centrales des boîtes englobantes
Dimensions de l'imageCarte thermique 2D largeur vs hauteur avec lignes de guidage du rapport d'aspect

Ultralytics Platform Datasets Charts Tab Statistics Grid

Mise en cache des statistiques

Les statistiques sont mises en cache pendant 5 minutes. Les modifications apportées aux annotations seront prises en compte après l'expiration du cache.

Cartes thermiques plein écran

Clique sur le bouton d'agrandissement sur n'importe quelle carte thermique pour l'afficher en mode plein écran. Cela offre une vue plus large et détaillée, utile pour comprendre les modèles spatiaux dans les grands jeux de données.

Onglet Modèles

Affiche tous les modèles entraînés sur ce jeu de données dans un tableau consultable :

ColonneDescription
NomNom du modèle avec lien
ProjetProjet parent avec icône
StatutBadge de statut d'entraînement
TâcheType de tâche YOLO
ÉpoquesMeilleure époque / total des époques
mAP50-95Précision moyenne (mAP)
mAP50mAP à IoU 0.50
CrééDate de création

Ultralytics Platform Datasets Models Tab Trained Models Table

Onglet Erreurs

Cet onglet n'apparaît que lorsqu'un ou plusieurs fichiers échouent au traitement.

Les images ayant échoué au traitement sont listées ici avec :

  • Bannière d'erreur : Nombre total d'images ayant échoué et conseils
  • Tableau d'erreurs : Nom du fichier, description de l'erreur conviviale, conseils de résolution et miniature d'aperçu
  • Les erreurs courantes incluent les fichiers corrompus, les formats non pris en charge, les images trop petites (min 28px) et les modes couleur non pris en charge

Ultralytics Platform Datasets Errors Tab Processing Failures

Erreurs de traitement courantes
ErreurCauseCorrection
Impossible de lire le fichier imageFormat corrompu ou non pris en chargeRéexporte depuis l'éditeur d'image
Incomplet ou corrompuLe fichier a été tronqué pendant le transfertRetélécharge le fichier original
Image trop petiteDimension minimale inférieure à 28pxUtilise des images sources de plus haute résolution
Mode couleur non pris en chargeMode couleur CMYK ou indexéConvertis en mode RVB

Onglet Versions

Crée des instantanés NDJSON immuables de ton jeu de données pour un entraînement reproductible. Chaque version capture le nombre d'images, de classes, d'annotations et la taille du fichier au moment de la création.

ColonneDescription
VersionNuméro de version (v1, v2, ...)
DescriptionDescription fournie par l'utilisateur (modifiable)
ImagesNombre d'images au moment de l'instantané
ClassesNombre de classes au moment de l'instantané
AnnotationsNombre d'annotations au moment de l'instantané
TailleTaille du fichier d'exportation NDJSON
CrééQuand la version a été créée

Pour créer une version :

  1. Ouvre l'onglet Versions
  2. Entre éventuellement une description (par ex. "Ajout de 500 images d'entraînement" ou "Correction de classes mal étiquetées")
  3. Clique sur + Nouvelle version
  4. La nouvelle version apparaît dans le tableau
  5. Télécharge la version séparément depuis le tableau si nécessaire

Chaque version est numérotée séquentiellement (v1, v2, v3...) et stockée de manière permanente. Tu peux télécharger n'importe quelle version précédente à tout moment depuis le tableau des versions.

Jeux de données prêts uniquement

La création de version est disponible une fois que le jeu de données atteint le statut ready.

Quand créer des versions

Crée une version avant et après des modifications majeures de ton jeu de données — ajout d'images, correction d'annotations ou rééquilibrage des ensembles. Cela te permet de comparer les performances du modèle selon différents états du jeu de données.

Taille du fichier NDJSON

La taille indiquée est celle du fichier d'exportation NDJSON, qui contient les URL des images et les annotations — pas les images elles-mêmes. Les données d'image réelles sont stockées séparément et accessibles via des URL signées.

Exporter le jeu de données

Exporte ton jeu de données pour une utilisation hors ligne avec un téléchargement NDJSON depuis l'en-tête du jeu de données ou l'onglet Versions.

Pour exporter :

  1. Clique sur le bouton Exporter dans l'en-tête du jeu de données
  2. Télécharge l'instantané NDJSON actuel directement
  3. Utilise l'onglet Versions quand tu souhaites un instantané numéroté immuable que tu peux retélécharger plus tard

Ultralytics Platform Datasets Export Ndjson Download

Le format NDJSON stocke un objet JSON par ligne. La première ligne contient les métadonnées du jeu de données, suivies d'une ligne par image :

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}
URL signées

Les URL des images dans le NDJSON exporté sont signées et valides pendant 7 jours. Si tu as besoin d'URL fraîches, réexporte le jeu de données ou crée une nouvelle version.

Consulte la documentation du format Ultralytics NDJSON pour la spécification complète.

Opérations sur les images

Actions rapides

Fais un clic droit sur n'importe quelle image dans la vue Grille ou Compacte pour accéder aux actions rapides :

ActionDescription
Déplacer vers l'ensembleRéassigne l'image à une répartition Entraînement, Validation ou Test
TéléchargerTélécharge le fichier image original
SupprimerSupprime l'image du dataset

Ultralytics Platform Datasets Image Card Context Menu

Individuel vs Groupe

Le menu contextuel d'image s'applique à une seule image. Pour des opérations groupées sur plusieurs images, utilise la vue Tableau avec la sélection par cases à cocher.

Déplacement groupé vers une répartition

Réassigne les images sélectionnées à une répartition différente au sein du même dataset :

  1. Passe à la vue Tableau
  2. Sélectionne les images en utilisant les cases à cocher
  3. Fais un clic droit pour ouvrir le menu contextuel
  4. Choisis Move to split > Train, Validation ou Test

Tu peux aussi faire glisser et déposer les images sur les onglets de filtre de répartition dans la vue en grille.

Organiser les répartitions Train/Val

Charge toutes les images dans un seul dataset, puis utilise le déplacement groupé pour organiser les sous-ensembles en répartitions d'entraînement, de validation et de test.

Redistribution des répartitions

Redistribue toutes les images entre les répartitions d'entraînement, de validation et de test en utilisant des ratios personnalisés :

  1. Clique sur la barre de répartition dans la barre d'outils du dataset pour ouvrir la boîte de dialogue Redistribute Splits
  2. Ajuste les pourcentages de répartition en utilisant l'une des méthodes ci-dessous
  3. Consulte l'aperçu du nombre d'images en direct pour confirmer la distribution
  4. Clique sur Apply pour réassigner aléatoirement toutes les images selon tes pourcentages

Ultralytics Platform Datasets Split Redistribution Dialog

La boîte de dialogue propose trois façons de définir tes ratios de répartition cibles :

MéthodeDescription
GlisserFais glisser les poignées entre les segments colorés pour ajuster visuellement les limites des répartitions
SaisirModifie le pourcentage saisi pour n'importe quelle répartition (les deux autres répartitions se rééquilibrent automatiquement proportionnellement)
AutoUn clic pour définir instantanément une répartition 80/20 entraînement/validation avec la répartition de test fixée à 0%

Un aperçu en direct montre exactement combien d'images atterriront dans chaque répartition avant que tu n'appliques les changements.

Répartition rapide 80/20

Clique sur le bouton Auto pour définir instantanément la répartition recommandée de 80/20 pour l'entraînement/validation. C'est le ratio le plus courant pour l'entraînement.

Suppression groupée

Supprime plusieurs images à la fois :

  1. Sélectionne les images dans la vue tableau
  2. Fais un clic droit et choisis Delete
  3. Confirme la suppression

URI du Dataset

Référence les datasets de la Platform en utilisant le format d'URI ul:// (voir Using Platform Datasets) :

ul://username/datasets/dataset-slug

Utilise cet URI pour entraîner des modèles depuis n'importe où :

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
Entraîne n'importe où avec les données de la Platform

L'URI ul:// fonctionne depuis n'importe quel environnement :

  • Machine locale : Entraîne sur ton matériel, les données sont téléchargées automatiquement
  • Google Colab : Accède à tes datasets de la Platform dans des notebooks
  • Serveurs distants : Entraîne sur des machines virtuelles cloud avec un accès complet au dataset

Licences disponibles

La Platform prend en charge les licences suivantes pour les datasets :

LicenceType
AucuneAucune licence sélectionnée
CC0-1.0Domaine public
CC-BY-2.5Permissive
CC-BY-4.0Permissive
CC-BY-SA-4.0Copyleft
CC-BY-NC-4.0Non-commercial
CC-BY-NC-SA-4.0Copyleft
CC-BY-ND-4.0No derivatives
CC-BY-NC-ND-4.0Non-commercial
Apache-2.0Permissive
MITPermissive
AGPL-3.0Copyleft
GPL-3.0Copyleft
Research-OnlyRestricted
AutrePersonnalisé
Licences Copyleft

Lors du clonage d'un dataset avec une licence copyleft (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), le clone hérite de la licence et le sélecteur de licence est verrouillé.

Paramètres de visibilité

Contrôle qui peut voir ton dataset :

ParamètreDescription
PrivéToi seul peux y accéder
PublicTout le monde peut le voir sur la page Explorer

La visibilité est définie lors de la création d'un dataset dans la boîte de dialogue New Dataset à l'aide d'un commutateur. Les datasets publics sont visibles sur la page Explore.

Modifier le dataset

Les métadonnées du dataset sont modifiées en ligne directement sur la page du dataset — aucune boîte de dialogue nécessaire :

  • Nom : Clique sur le nom du dataset pour le modifier. Les changements sont enregistrés automatiquement lors de la perte du focus ou en appuyant sur Enter.
  • Description : Clique sur la description (ou l'espace réservé "Add a description...") pour modifier. Les changements sont enregistrés automatiquement.
  • Type de tâche : Clique sur le badge de tâche pour sélectionner un type de tâche différent.
  • Licence : Clique sur le sélecteur de licence pour changer la licence du dataset.
Changer le type de tâche

Chaque image stocke les annotations pour tous les types de tâches ensemble. Changer le type de tâche du dataset contrôle quelles annotations sont visibles dans l'éditeur et incluses dans les exportations et l'entraînement. Les annotations pour les autres types de tâches sont conservées dans la base de données et réapparaissent lorsque tu reviens en arrière.

Cloner le dataset

Lorsque tu consultes un dataset public dont tu n'es pas propriétaire, clique sur Clone Dataset pour en créer une copie dans ton espace de travail. Le clone inclut toutes les images, annotations et définitions de classes. Si le dataset original a une licence copyleft, le clone en hérite et le sélecteur de licence est verrouillé.

Mettre en favori et Partager

  • Mettre en favori : Clique sur le bouton étoile pour mettre un dataset en favori. Le nombre de favoris est visible par tous les utilisateurs.
  • Partager : Pour les datasets publics, clique sur le bouton partager pour copier un lien ou partager sur les réseaux sociaux.

Supprimer le dataset

Supprime un dataset dont tu n'as plus besoin :

  1. Ouvre le menu d'actions du dataset
  2. Clique sur Delete
  3. Confirme dans la boîte de dialogue : "This will move [name] to trash. You can restore it within 30 days."
Corbeille et restauration

Deleted datasets are moved to Trash — not permanently deleted. You can restore them within 30 days from Settings > Trash.

Entraîner sur un jeu de données

Lance l'entraînement directement depuis ton jeu de données :

  1. Click New Model on the dataset page
  2. Sélectionne un projet ou crées-en un nouveau
  3. Configure les paramètres d'entraînement
  4. Démarre l'entraînement
graph LR
    A[Dataset] --> B[New Model]
    B --> C[Select Project]
    C --> D[Configure]
    D --> E[Start Training]

    style A fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Consulte Entraînement dans le cloud pour plus de détails.

FAQ

Qu'advient-il de mes données après le téléchargement ?

Tes données sont traitées et stockées dans la région que tu as sélectionnée (US, EU ou AP). Les images sont :

  1. Validées pour leur format et leur taille
  2. Rejetées si la dimension minimale est inférieure à 28px
  3. Normalisées si elles dépassent 4096px (en préservant le rapport hauteur/largeur ; encodées pour un stockage optimisé)
  4. Stockées en utilisant le stockage adressable par contenu (CAS) avec un hachage XXH3-128
  5. Miniatures générées en 256px WebP pour une navigation rapide

Comment fonctionne le stockage ?

La plateforme Ultralytics utilise le stockage adressable par contenu (CAS) pour un stockage efficace :

  • Dédoublonnage : les images identiques téléchargées par différents utilisateurs ne sont stockées qu'une seule fois
  • Intégrité : le hachage XXH3-128 garantit l'intégrité des données
  • Efficacité : réduit les coûts de stockage et accélère le traitement
  • Régional : tes données restent dans la région sélectionnée (US, EU ou AP)

Puis-je ajouter des images à un jeu de données existant ?

Oui, fais glisser et dépose tes fichiers sur la page du jeu de données ou utilise le bouton de téléchargement pour ajouter des images supplémentaires. De nouvelles statistiques seront calculées automatiquement.

Comment déplacer des images entre les jeux de données ?

Utilise la fonctionnalité de déplacement en masse vers un jeu :

  1. Sélectionne les images dans la vue tableau
  2. Right-click and choose Move to split
  3. Sélectionne le jeu cible (Entraînement, Validation ou Test)

Quels formats d'étiquettes sont pris en charge ?

La plateforme Ultralytics prend en charge les étiquettes YOLO, COCO JSON, Ultralytics NDJSON et les téléchargements d'images brutes :

Un fichier .txt par image avec des coordonnées normalisées (plage 0-1) :

TâcheFormatExemple
Detectclass cx cy w h0 0.5 0.5 0.2 0.3
Segmentclass x1 y1 x2 y2 ...0 0.1 0.1 0.9 0.1 0.9 0.9
Poseclass cx cy w h kx1 ky1 v1 ...0 0.5 0.5 0.2 0.3 0.6 0.7 2
OBBclass x1 y1 x2 y2 x3 y3 x4 y40 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9
ClassifyStructure des répertoirestrain/cats/, train/dogs/

Drapeaux de visibilité de pose : 0=non étiqueté, 1=étiqueté mais occlus, 2=étiqueté et visible.

Puis-je annoter le même jeu de données pour plusieurs types de tâches ?

Oui. Chaque image stocke les annotations pour les 5 types de tâches (détection, segmentation, pose, OBB, classification) ensemble. Tu peux changer le type de tâche actif du jeu de données à tout moment sans perdre les annotations existantes. Seules les annotations correspondant au type de tâche actif sont affichées dans l'éditeur et incluses dans les exportations et l'entraînement — les annotations pour les autres tâches sont conservées et réapparaissent lorsque tu changes de nouveau.

Commentaires