Overslaan naar inhoud

Tijger-Pose Dataset

Inleiding

Ultralytics introduceert de Tiger-Pose dataset, een veelzijdige verzameling die is ontworpen voor het schatten van houdingen. Deze dataset bestaat uit 263 afbeeldingen afkomstig van een YouTube-video, waarbij 210 afbeeldingen zijn toegewezen voor training en 53 voor validatie. Het dient als een uitstekende bron voor het testen en oplossen van problemen met algoritmen voor het schatten van de houding.

Ondanks de hanteerbare grootte van 210 afbeeldingen, biedt de tijger-pose dataset diversiteit, waardoor het geschikt is voor het beoordelen van trainingslijnen, het identificeren van potentiƫle fouten, en dient als een waardevolle voorbereidende stap voor het werken met grotere datasets voor pose schatting.

Deze dataset is bedoeld voor gebruik met Ultralytics HUB en YOLOv8.



Kijken: Train YOLOv8 Pose Model op Tiger-Pose Dataset met Ultralytics HUB

Dataset YAML

Een YAML (Yet Another Markup Language) bestand dient als middel om de configuratiedetails van een dataset te specificeren. Het bevat cruciale gegevens zoals bestandspaden, klassedefinities en andere relevante informatie. Specifiek voor de tiger-pose.yaml bestand, kun je het volgende controleren Ultralytics Tiger-Pose Dataset Configuratiebestand.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO šŸš€, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ā”œā”€ā”€ ultralytics
# ā””ā”€ā”€ datasets
#     ā””ā”€ā”€ tiger-pose  ā† downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

Gebruik

Om een YOLOv8n-pose model te trainen op de Tiger-Pose dataset voor 100 epochs met een afbeeldingsgrootte van 640, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Voorbeeldafbeeldingen en -annotaties

Hier zijn enkele voorbeelden van afbeeldingen uit de Tiger-Pose dataset, samen met de bijbehorende annotaties:

Voorbeeldafbeelding dataset

  • GemozaĆÆekte afbeelding: Deze afbeelding toont een trainingsbatch die bestaat uit gemozaĆÆekte afbeeldingen van de dataset. MozaĆÆeken is een techniek die tijdens het trainen wordt gebruikt om meerdere afbeeldingen te combineren tot Ć©Ć©n afbeelding om de verscheidenheid aan objecten en scĆØnes binnen elke trainingsbatch te vergroten. Dit helpt het vermogen van het model om te generaliseren naar verschillende objectgroottes, beeldverhoudingen en contexten te verbeteren.

Het voorbeeld toont de verscheidenheid en complexiteit van de afbeeldingen in de Tiger-Pose dataset en de voordelen van het gebruik van mozaĆÆek tijdens het trainingsproces.

Voorbeeld van gevolgtrekking

Voorbeeld van gevolgtrekking

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

Citaten en erkenningen

De dataset is vrijgegeven onder de AGPL-3.0 Licentie.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-02-03
Auteurs: glenn-jocher (5), RizwanMunawar (1)

Reacties