Overslaan naar inhoud

Tijger-Pose Dataset

Inleiding

Ultralytics introduceert de Tiger-Pose dataset, een veelzijdige verzameling die is ontworpen voor het schatten van houdingen. Deze dataset bestaat uit 263 afbeeldingen afkomstig van een YouTube-video, waarbij 210 afbeeldingen zijn toegewezen voor training en 53 voor validatie. Het dient als een uitstekende bron voor het testen en oplossen van problemen met algoritmen voor het schatten van de houding.

Ondanks de hanteerbare grootte van 210 afbeeldingen, biedt de tijger-pose dataset diversiteit, waardoor het geschikt is voor het beoordelen van trainingslijnen, het identificeren van potentiële fouten, en dient als een waardevolle voorbereidende stap voor het werken met grotere datasets voor pose schatting.

Deze dataset is bedoeld voor gebruik met Ultralytics HUB en YOLOv8.



Kijken: Train YOLOv8 Pose Model op Tiger-Pose Dataset met Ultralytics HUB

Dataset YAML

Een YAML (Yet Another Markup Language) bestand dient als middel om de configuratiedetails van een dataset te specificeren. Het bevat cruciale gegevens zoals bestandspaden, klassedefinities en andere relevante informatie. Specifiek voor de tiger-pose.yaml bestand, kun je het volgende controleren Ultralytics Tiger-Pose Dataset Configuratiebestand.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Gebruik

Om een YOLOv8n-pose model te trainen op de Tiger-Pose dataset voor 100 epochs met een afbeeldingsgrootte van 640, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Voorbeeldafbeeldingen en -annotaties

Hier zijn enkele voorbeelden van afbeeldingen uit de Tiger-Pose dataset, samen met de bijbehorende annotaties:

Voorbeeldafbeelding dataset

  • Gemozaïekte afbeelding: Deze afbeelding toont een trainingsbatch die bestaat uit gemozaïekte afbeeldingen van de dataset. Mozaïeken is een techniek die tijdens het trainen wordt gebruikt om meerdere afbeeldingen te combineren tot één afbeelding om de verscheidenheid aan objecten en scènes binnen elke trainingsbatch te vergroten. Dit helpt het vermogen van het model om te generaliseren naar verschillende objectgroottes, beeldverhoudingen en contexten te verbeteren.

Het voorbeeld toont de verscheidenheid en complexiteit van de afbeeldingen in de Tiger-Pose dataset en de voordelen van het gebruik van mozaïek tijdens het trainingsproces.

Voorbeeld van gevolgtrekking

Voorbeeld van gevolgtrekking

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Citaten en erkenningen

De dataset is vrijgegeven onder de AGPL-3.0 Licentie.

FAQ

Waar wordt de Ultralytics Tiger-Pose dataset voor gebruikt?

De Ultralytics Tiger-Pose dataset is ontworpen voor houdingschattaken en bestaat uit 263 afbeeldingen afkomstig van een YouTube-video. De dataset is verdeeld in 210 trainingsafbeeldingen en 53 validatieafbeeldingen. De set is vooral nuttig voor het testen, trainen en verfijnen van algoritmen voor het schatten van de houding met Ultralytics HUB en . YOLOv8.

Hoe train ik een YOLOv8 model op de Tiger-Pose dataset?

Om een YOLOv8n-pose model te trainen op de Tiger-Pose dataset voor 100 epochs met een afbeeldingsgrootte van 640, gebruik je de volgende codefragmenten. Ga voor meer details naar de pagina Training:

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Welke configuraties heeft de tiger-pose.yaml bestand opnemen?

De tiger-pose.yaml bestand wordt gebruikt om de configuratiedetails van de Tiger-Pose dataset op te geven. Het bevat cruciale gegevens zoals bestandspaden en klassedefinities. Om de exacte configuratie te zien, kun je de Ultralytics Tiger-Pose Dataset Configuratiebestand.

Hoe kan ik inferentie uitvoeren met een YOLOv8 model dat is getraind op de Tiger-Pose dataset?

Om inferentie uit te voeren met behulp van een YOLOv8 model dat is getraind op de Tiger-Pose dataset, kun je de volgende codefragmenten gebruiken. Ga voor een gedetailleerde handleiding naar de voorspellingspagina:

Voorbeeld van gevolgtrekking

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Wat zijn de voordelen van het gebruik van de Tiger-Pose dataset voor het schatten van houdingen?

De Tiger-Pose dataset biedt, ondanks de hanteerbare grootte van 210 afbeeldingen voor training, een gevarieerde verzameling afbeeldingen die ideaal zijn voor het testen van pose estimation pipelines. De dataset helpt bij het identificeren van potentiële fouten en fungeert als een voorbereidende stap voor het werken met grotere datasets. Daarnaast ondersteunt de dataset de training en verfijning van algoritmen voor het schatten van de pose met geavanceerde tools zoals Ultralytics HUB en HUB, waardoor de prestaties en nauwkeurigheid van het model verbeteren. YOLOv8om de prestaties en nauwkeurigheid van het model te verbeteren.



Aangemaakt 2023-11-12, Bijgewerkt 2024-07-04
Auteurs: glenn-jocher (9), RizwanMunawar (1)

Reacties