İçeriğe geç

Kaplan-Poz Veri Kümesi

Giriş

Ultralytics poz tahmini görevleri için tasarlanmış çok yönlü bir koleksiyon olan Tiger-Pose veri setini tanıtmaktadır. Bu veri kümesi, bir YouTube videosundan alınan 263 görüntüden oluşmakta olup 210 görüntü eğitim ve 53 görüntü de doğrulama için ayrılmıştır. Poz tahmin algoritmasını test etmek ve sorun gidermek için mükemmel bir kaynak olarak hizmet vermektedir.

Kaplan pozu veri kümesi, 210 görüntüden oluşan yönetilebilir boyutuna rağmen çeşitlilik sunmakta, bu da onu eğitim işlem hatlarını değerlendirmek, olası hataları belirlemek ve poz tahmini için daha büyük veri kümeleriyle çalışmadan önce değerli bir ön adım olarak hizmet etmek için uygun hale getirmektedir.

Bu veri seti Ultralytics HUB ile kullanılmak üzere tasarlanmıştır ve YOLOv8.



İzle: Ultralytics HUB Kullanarak Tiger-Pose Veri Setinde YOLOv8 Pose Modelini Eğitin

Veri Kümesi YAML

Bir YAML (Yet Another Markup Language) dosyası, bir veri kümesinin yapılandırma ayrıntılarını belirtmek için bir araç görevi görür. Dosya yolları, sınıf tanımları ve diğer ilgili bilgiler gibi önemli verileri kapsar. Özellikle, için tiger-pose.yaml dosyasında, kontrol edebilirsiniz Ultralytics Tiger-Pose Veri Seti Yapılandırma Dosyası.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

Kullanım

Bir YOLOv8n-pose modelini 640 görüntü boyutuyla 100 epok için Tiger-Pose veri kümesi üzerinde eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Örnek Görüntüler ve Açıklamalar

Tiger-Pose veri kümesinden bazı görüntü örnekleri ve bunlara karşılık gelen ek açıklamalar aşağıda verilmiştir:

Veri kümesi örnek görüntüsü

  • Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri kümesi görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, eğitim sırasında kullanılan ve her bir eğitim grubundaki nesne ve sahne çeşitliliğini artırmak için birden fazla görüntüyü tek bir görüntüde birleştiren bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.

Bu örnek, Tiger-Pose veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaikleme kullanmanın faydalarını göstermektedir.

Çıkarım Örneği

Çıkarım Örneği

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

Atıflar ve Teşekkür

Veri seti AGPL-3.0 Lisansı altında kullanıma sunulmuştur.



Oluşturma 2023-11-12, Güncelleme 2024-02-03
Yazarlar: glenn-jocher (5), RizwanMunawar (1)

Yorumlar