Skip to content

Aperçu des ensembles de données pour l'estimation de la pose

Formats de données pris en charge

Ultralytics YOLO format

Le format d'étiquetage de l'ensemble de données utilisé pour la formation des modèles de pose YOLO est le suivant :

  1. Un fichier texte par image : Chaque image de l'ensemble de données a un fichier texte correspondant portant le même nom que le fichier image et l'extension ".txt".
  2. Une ligne par objet : Chaque ligne du fichier texte correspond Ă  une instance d'objet dans l'image.
  3. Informations sur l'objet par ligne : Chaque ligne contient les informations suivantes sur l'instance d'objet :
    • Indice de classe de l'objet : Un nombre entier reprĂ©sentant la classe de l'objet (par exemple, 0 pour une personne, 1 pour une voiture, etc.)
    • CoordonnĂ©es du centre de l'objet : CoordonnĂ©es x et y du centre de l'objet, normalisĂ©es pour ĂŞtre comprises entre 0 et 1.
    • Largeur et hauteur de l'objet : La largeur et la hauteur de l'objet, normalisĂ©es pour ĂŞtre comprises entre 0 et 1.
    • CoordonnĂ©es des points clĂ©s de l'objet : Les points clĂ©s de l'objet, normalisĂ©s pour ĂŞtre compris entre 0 et 1.

Voici un exemple de format d'étiquette pour la tâche d'estimation de la pose :

Format avec Dim = 2

<class-index> <x> <y> <width> <height> <px1> <py1> <px2> <py2> ... <pxn> <pyn>

Format avec Dim = 3

<class-index> <x> <y> <width> <height> <px1> <py1> <p1-visibility> <px2> <py2> <p2-visibility> <pxn> <pyn> <p2-visibility>

Dans ce format, <class-index> est l'indice de la classe de l'objet,<x> <y> <width> <height> sont les coordonnées de boîte de délimitationet <px1> <py1> <px2> <py2> ... <pxn> <pyn> sont les coordonnées en pixels des points clés. Les coordonnées sont séparées par des espaces.

Format YAML du jeu de données

Le cadre Ultralytics utilise un format de fichier YAML pour définir l'ensemble de données et la configuration du modèle pour la formation des modèles de détection. Voici un exemple du format YAML utilisé pour définir un ensemble de données de détection :

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8-pose # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# Classes dictionary
names:
    0: person

Le train et val précisent les chemins d'accès aux répertoires contenant les images d'apprentissage et de validation, respectivement.

names est un dictionnaire de noms de classes. L'ordre des noms doit correspondre à l'ordre des indices des classes d'objets dans les fichiers du jeu de données YOLO .

(Facultatif) si les points sont symétriques, il faut utiliser flip_idx, comme le côté gauche-droit d'un humain ou d'un visage. Par exemple, si nous supposons cinq points clés du repère facial : [œil gauche, œil droit, nez, bouche gauche, bouche droite], et que l'index original est [0, 1, 2, 3, 4], alors flip_idx est [1, 0, 2, 4, 3] (il suffit d'échanger l'index gauche-droite, c'est-à-dire 0-1 et 3-4, et de ne pas modifier les autres, comme le nez dans cet exemple).

Utilisation

Exemple

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Ensembles de données pris en charge

Cette section présente les ensembles de données compatibles avec le format Ultralytics YOLO et qui peuvent être utilisés pour l'entraînement des modèles d'estimation de la pose :

COCO-Pose

  • Description: COCO-Pose est un ensemble de donnĂ©es Ă  grande Ă©chelle pour la dĂ©tection d'objets, la segmentation et l'estimation de la pose. Il s'agit d'un sous-ensemble de l'ensemble de donnĂ©es populaire COCO qui se concentre sur l'estimation de la pose humaine. COCO-Pose comprend plusieurs points clĂ©s pour chaque instance humaine.
  • Format de l'Ă©tiquette: Identique au format Ultralytics YOLO dĂ©crit ci-dessus, avec des points clĂ©s pour les poses humaines.
  • Nombre de classes: 1 (Humain).
  • Points clĂ©s: 17 points clĂ©s dont le nez, les yeux, les oreilles, les Ă©paules, les coudes, les poignets, les hanches, les genoux et les chevilles.
  • Utilisation: Convient Ă  l'entraĂ®nement des modèles d'estimation de la pose humaine.
  • Notes supplĂ©mentaires: Le jeu de donnĂ©es est riche et diversifiĂ©, contenant plus de 200 000 images Ă©tiquetĂ©es.
  • En savoir plus sur COCO-Pose

COCO8-Pose

  • Description: Ultralytics COCO8-Pose est un ensemble de donnĂ©es de dĂ©tection de pose, petit mais polyvalent, composĂ© des 8 premières images de l'ensemble COCO train 2017, 4 pour l'entraĂ®nement et 4 pour la validation.
  • Format de l'Ă©tiquette: Identique au format Ultralytics YOLO dĂ©crit ci-dessus, avec des points clĂ©s pour les poses humaines.
  • Nombre de classes: 1 (Humain).
  • Points clĂ©s: 17 points clĂ©s dont le nez, les yeux, les oreilles, les Ă©paules, les coudes, les poignets, les hanches, les genoux et les chevilles.
  • Utilisation: Convient pour tester et dĂ©boguer les modèles de dĂ©tection d'objets, ou pour expĂ©rimenter de nouvelles approches de dĂ©tection.
  • Notes supplĂ©mentaires: COCO8-Pose est idĂ©al pour les contrĂ´les de cohĂ©rence et les contrĂ´les d'intĂ©gritĂ©.
  • En savoir plus sur COCO8-Pose

Pose du tigre

  • Description: Ultralytics Cet ensemble de donnĂ©es sur les poses d'animaux comprend 263 images provenant d'une vidĂ©o YouTube, dont 210 images pour la formation et 53 pour la validation.
  • Format de l'Ă©tiquette: Identique au format Ultralytics YOLO dĂ©crit ci-dessus, avec 12 points clĂ©s pour la pose de l'animal et aucune dimension visible.
  • Nombre de classes: 1 (Tigre).
  • Points clĂ©s: 12 points clĂ©s.
  • Utilisation: IdĂ©al pour les poses d'animaux ou toute autre pose qui n'est pas humaine.
  • Plus d'informations sur Tiger-Pose

Points clés de la main

  • Description: L'ensemble de donnĂ©es sur la pose des points clĂ©s de la main comprend près de 26 000 images, dont 18 776 images pour la formation et 7 992 pour la validation.
  • Format de l'Ă©tiquette: Identique au format Ultralytics YOLO dĂ©crit ci-dessus, mais avec 21 points clĂ©s pour la main humaine et la dimension visible.
  • Nombre de classes: 1 (main).
  • Points clĂ©s: 21 points clĂ©s.
  • Utilisation: IdĂ©al pour l'estimation de la pose de la main humaine.
  • En savoir plus sur les points clĂ©s de la main

La posture du chien

  • Description: L'ensemble de donnĂ©es Dog Pose contient environ 6 000 images, fournissant une ressource diversifiĂ©e et Ă©tendue pour l'entraĂ®nement et la validation des modèles d'estimation de la pose du chien.
  • Format de l'Ă©tiquette: Le format de l'Ă©tiquette suit celui du site Ultralytics YOLO , avec des annotations pour plusieurs points clĂ©s spĂ©cifiques Ă  l'anatomie du chien.
  • Nombre de classes: 1 (chien).
  • Points clĂ©s: Comprend 24 points clĂ©s adaptĂ©s aux poses du chien, tels que la position des membres, des articulations et de la tĂŞte.
  • Utilisation: IdĂ©al pour la formation de modèles permettant d'estimer la position des chiens dans divers scĂ©narios, de la recherche aux applications du monde rĂ©el.
  • Plus d'informations sur Dog-Pose

Ajouter votre propre jeu de données

Si vous disposez de votre propre ensemble de données et souhaitez l'utiliser pour entraîner des modèles d'estimation de la pose avec le format Ultralytics YOLO , assurez-vous qu'il respecte le format spécifié ci-dessus sous "Ultralytics YOLO format". Convertissez vos annotations au format requis et spécifiez les chemins, le nombre de classes et les noms des classes dans le fichier de configuration YAML.

Outil de conversion

Ultralytics fournit un outil de conversion pratique pour convertir les étiquettes du format de jeu de données COCO au format YOLO :

Exemple

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/", use_keypoints=True)

Cet outil de conversion peut être utilisé pour convertir le jeu de données COCO ou tout autre jeu de données au format COCO au format Ultralytics YOLO . L'outil de conversion use_keypoints spécifie s'il faut inclure les points clés (pour l'estimation de la pose) dans les étiquettes converties.

FAQ

Quel est le format Ultralytics YOLO pour l'estimation de la pose ?

Le format Ultralytics YOLO pour les ensembles de données d'estimation de la pose implique l'étiquetage de chaque image avec un fichier texte correspondant. Chaque ligne du fichier texte contient des informations sur une instance d'objet :

  • Index de la classe d'objets
  • CoordonnĂ©es du centre de l'objet (normalisĂ©es x et y)
  • Largeur et hauteur de l'objet (normalisĂ©es)
  • CoordonnĂ©es des points clĂ©s de l'objet (pxn et pyn normalisĂ©s)

Pour les poses en 2D, les points clés comprennent les coordonnées des pixels. Pour les poses en 3D, chaque point clé possède également un indicateur de visibilité. Pour plus de détails, voir Ultralytics YOLO format.

Comment utiliser l'ensemble de données COCO-Pose avec Ultralytics YOLO ?

Pour utiliser l'ensemble de données COCO-Pose avec Ultralytics YOLO :

  1. Téléchargez le jeu de données et préparez vos fichiers d'étiquettes au format YOLO .
  2. Créer un fichier de configuration YAML spécifiant les chemins d'accès aux images d'entraînement et de validation, la forme des points clés et les noms des classes.
  3. Utiliser le fichier de configuration pour la formation :

    from ultralytics import YOLO
    
    model = YOLO("yolo11n-pose.pt")  # load pretrained model
    results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)
    

    Pour plus d'informations, consultez les sections COCO-Pose et train.

Comment puis-je ajouter mon propre jeu de données pour l'estimation de la pose dans Ultralytics YOLO ?

Pour ajouter votre jeu de données :

  1. Convertissez vos annotations au format Ultralytics YOLO .
  2. Créer un fichier de configuration YAML spécifiant les chemins d'accès aux jeux de données, le nombre de classes et les noms des classes.
  3. Utilisez le fichier de configuration pour entraîner votre modèle :

    from ultralytics import YOLO
    
    model = YOLO("yolo11n-pose.pt")
    results = model.train(data="your-dataset.yaml", epochs=100, imgsz=640)
    

    Pour connaître les étapes complètes, consultez la section Ajouter votre propre jeu de données.

Quel est l'objectif du fichier YAML de l'ensemble de données dans Ultralytics YOLO ?

Le fichier YAML dataset sur Ultralytics YOLO définit le jeu de données et la configuration du modèle pour l'entraînement. Il spécifie les chemins d'accès aux images d'entraînement, de validation et de test, les formes des points clés, les noms des classes et d'autres options de configuration. Ce format structuré permet de rationaliser la gestion des ensembles de données et la formation des modèles. Voici un exemple de format YAML :

path: ../datasets/coco8-pose
train: images/train
val: images/val
names:
    0: person

En savoir plus sur la création de fichiers de configuration YAML dans le format Dataset YAML.

Comment puis-je convertir les étiquettes du jeu de données COCO au format Ultralytics YOLO pour l'estimation de la pose ?

Ultralytics fournit un outil de conversion pour convertir les étiquettes des jeux de données COCO au format YOLO , y compris les informations sur les points clés :

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/", use_keypoints=True)

Cet outil permet d'intégrer de manière transparente les jeux de données COCO dans les projets YOLO . Pour plus de détails, voir la section Outil de conversion.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires