Köpek Pozu Veri Kümesi
Giriş
Bu Ultralytics Dog-pose veri kümesi, köpek anahtar noktası tahmini için özel olarak hazırlanmış yüksek kaliteli ve kapsamlı bir veri kümesidir. 6.773 eğitim görüntüsü ve 1.703 test görüntüsü içeren bu veri seti, sağlam poz tahmin modellerinin eğitimi için sağlam bir temel sağlar. Açıklamalı her görüntü, anahtar nokta başına 3 boyuta (x, y, görünürlük) sahip 24 anahtar nokta içerir ve bu da onu bilgisayarla görme alanında ileri araştırma ve geliştirme için değerli bir kaynak haline getirir.
Bu veri seti Ultralytics HUB ile kullanılmak üzere tasarlanmıştır ve YOLO11.
Veri Kümesi YAML
Veri kümesi yapılandırmasını tanımlamak için bir YAML (Yet Another Markup Language) dosyası kullanılır. Yolları, anahtar nokta ayrıntılarını ve diğer ilgili bilgileri içerir. Dog-pose veri kümesi söz konusu olduğunda dog-pose.yaml
adresinde mevcuttur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Kullanım
Bir YOLO11n-pose modelini 640 görüntü boyutuyla 100 epok için Dog-pose veri kümesi üzerinde eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.
Tren Örneği
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Örnek Görüntüler ve Açıklamalar
Aşağıda Dog-pose veri kümesinden bazı görüntü örnekleri ve bunlara karşılık gelen açıklamalar yer almaktadır:
- Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri kümesi görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, eğitim sırasında kullanılan ve her bir eğitim grubundaki nesne ve sahne çeşitliliğini artırmak için birden fazla görüntüyü tek bir görüntüde birleştiren bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.
Bu örnek, Dog-pose veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaikleme kullanmanın faydalarını göstermektedir.
Atıflar ve Teşekkür
Araştırma veya geliştirme çalışmalarınızda Dog-pose veri setini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Bilgisayarla görme topluluğu için bu değerli kaynağı yaratan ve sürdüren Stanford ekibine teşekkür ederiz. Dog-pose veri seti ve yaratıcıları hakkında daha fazla bilgi için Stanford Dogs Dataset web sitesini ziyaret edin.
SSS
Dog-pose veri seti nedir ve Ultralytics YOLO11 ile nasıl kullanılır?
Dog-Pose veri kümesi, köpek pozu tahmini için 24 anahtar nokta ile açıklanmış 6.773 eğitim ve 1.703 test görüntüsü içerir. ile modelleri eğitmek ve doğrulamak için tasarlanmıştır. Ultralytics YOLO11Hayvan davranış analizi, evcil hayvan izleme ve veterinerlik çalışmaları gibi uygulamaları destekler. Veri setinin kapsamlı açıklamaları, köpekler için doğru poz tahmin modelleri geliştirmek için idealdir.
Ultralytics adresindeki Dog-pose veri kümesini kullanarak bir YOLO11 modelini nasıl eğitebilirim?
Bir YOLO11n-pose modelini 640 görüntü boyutuyla 100 epok için Dog-pose veri kümesi üzerinde eğitmek için aşağıdaki örnekleri izleyin:
Tren Örneği
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Eğitim argümanlarının kapsamlı bir listesi için Model Eğitimi sayfasına bakın.
Dog-pose veri setini kullanmanın faydaları nelerdir?
Dog-pose veri seti çeşitli avantajlar sunmaktadır:
Büyük ve Çeşitli Veri Kümesi: 8.400'den fazla görüntü ile çok çeşitli köpek pozlarını, ırklarını ve bağlamlarını kapsayan önemli veriler sağlayarak sağlam model eğitimi ve değerlendirmesine olanak tanır.
Ayrıntılı Anahtar Nokta Ek Açıklamaları: Her görüntü, anahtar nokta başına 3 boyuta (x, y, görünürlük) sahip 24 anahtar nokta içerir ve doğru poz algılama modellerini eğitmek için hassas ek açıklamalar sunar.
Gerçek Dünya Senaryoları: Çeşitli ortamlardan görüntüler içerir ve modelin evcil hayvan izleme ve davranış analizi gibi gerçek dünya uygulamalarına genelleme yeteneğini geliştirir.
Transfer Öğrenme Avantajı: Veri kümesi, transfer öğrenme teknikleriyle iyi çalışır ve insan pozu veri kümeleri üzerinde önceden eğitilmiş modellerin köpeğe özgü özelliklere uyum sağlamasına olanak tanır.
Özellikleri ve kullanımı hakkında daha fazla bilgi için Veri Kümesi Tanıtımı bölümüne bakın.
Mozaikleme, Dog-pose veri kümesini kullanarak YOLO11 eğitim sürecine nasıl fayda sağlar?
Dog-pose veri kümesindeki örnek görüntülerde gösterildiği gibi mozaikleme, birden fazla görüntüyü tek bir kompozitte birleştirerek her eğitim grubundaki nesne ve sahne çeşitliliğini zenginleştirir. Bu teknik çeşitli avantajlar sunar:
- Her partideki köpek pozlarının, boyutlarının ve arka planlarının çeşitliliğini artırır
- Modelin farklı bağlamlarda ve ölçeklerde köpekleri tespit etme becerisini geliştirir
- Modeli daha çeşitli görsel modellere maruz bırakarak genellemeyi geliştirir
- Eğitim örneklerinin yeni kombinasyonlarını oluşturarak aşırı uyumu azaltır
Bu yaklaşım, gerçek dünya senaryolarında daha iyi performans gösteren daha sağlam modellerin ortaya çıkmasını sağlar. Örnek görüntüler için Örnek Görüntüler ve Açıklamalar bölümüne bakın.
Dog-pose veri kümesi YAML dosyasını nerede bulabilirim ve nasıl kullanabilirim?
Dog-pose veri kümesi YAML dosyası ultralytics adresinde bulunabilir. Bu dosya, yollar, sınıflar, anahtar nokta ayrıntıları ve diğer ilgili bilgiler dahil olmak üzere veri kümesi yapılandırmasını tanımlar. YAML, anahtar nokta başına 3 boyuta sahip 24 anahtar nokta belirtir ve bu da onu ayrıntılı poz tahmini görevleri için uygun hale getirir.
Bu dosyayı YOLO11 eğitim komut dosyalarıyla kullanmak için, Kullanım bölümünde gösterildiği gibi eğitim komutunuzda referans vermeniz yeterlidir. Veri seti ilk kullanıldığında otomatik olarak indirilecek ve kurulumu kolaylaştıracaktır.
Daha fazla SSS ve ayrıntılı dokümantasyon için Ultralytics Dokümantasyonunu ziyaret edin.