─░├žeri─če ge├ž

COCO-Poz Veri K├╝mesi

COCO-Pose veri k├╝mesi, COCO (Common Objects in Context) veri k├╝mesinin poz tahmini g├Ârevleri i├žin tasarlanm─▒┼č ├Âzel bir s├╝r├╝m├╝d├╝r. Poz tahmini g├Ârevleri i├žin YOLO gibi modellerin e─čitilmesini sa─člamak ├╝zere COCO Keypoints 2017 g├Âr├╝nt├╝lerinden ve etiketlerinden yararlan─▒r.

Poz ├Ârnek g├Âr├╝nt├╝s├╝

COCO-Poz ├ľnceden E─čitilmi┼č Modeller

Model boyut
(piksel)
mAPpose
50-95
mAPpose
50
H─▒z
CPU ONNX
(ms)
H─▒z
A100 TensorRT
(ms)
params
(M)
FLOP'lar
(B)
YOLOv8n-pose 640 50.4 80.1 131.8 1.18 3.3 9.2
YOLOv8s-pose 640 60.0 86.2 233.2 1.42 11.6 30.2
YOLOv8m-pose 640 65.0 88.8 456.3 2.00 26.4 81.0
YOLOv8l-pose 640 67.6 90.0 784.5 2.59 44.4 168.6
YOLOv8x-pose 640 69.2 90.2 1607.1 3.73 69.4 263.2
YOLOv8x-pose-p6 1280 71.6 91.2 4088.7 10.04 99.1 1066.4

Temel ├ľzellikler

  • COCO-Pose, poz tahmini g├Ârevleri i├žin anahtar noktalarla etiketlenmi┼č 200 bin g├Âr├╝nt├╝ i├žeren COCO Keypoints 2017 veri k├╝mesi ├╝zerine kurulmu┼čtur.
  • Veri seti, insan fig├╝rleri i├žin 17 anahtar noktay─▒ destekleyerek ayr─▒nt─▒l─▒ poz tahminini kolayla┼čt─▒r─▒r.
  • COCO gibi, poz tahmini g├Ârevleri i├žin Nesne Anahtar Noktas─▒ Benzerli─či (OKS) dahil olmak ├╝zere standartla┼čt─▒r─▒lm─▒┼č de─čerlendirme metrikleri sa─člar ve model performans─▒n─▒ kar┼č─▒la┼čt─▒rmak i├žin uygun hale getirir.

Veri K├╝mesi Yap─▒s─▒

COCO-Pose veri k├╝mesi ├╝├ž alt k├╝meye ayr─▒lm─▒┼čt─▒r:

  1. Train2017: Bu alt k├╝me, COCO veri k├╝mesindeki 118 bin g├Âr├╝nt├╝n├╝n bir k─▒sm─▒n─▒ i├žerir ve poz tahmin modellerini e─čitmek i├žin a├ž─▒klama eklenmi┼čtir.
  2. Val2017: Bu alt k├╝me, model e─čitimi s─▒ras─▒nda do─črulama amac─▒yla kullan─▒lan g├Âr├╝nt├╝lerden olu┼čan bir se├žkiye sahiptir.
  3. Test2017: Bu alt k├╝me, e─čitilen modelleri test etmek ve k─▒yaslamak i├žin kullan─▒lan g├Âr├╝nt├╝lerden olu┼čur. Bu alt k├╝me i├žin temel ger├žek a├ž─▒klamalar─▒ kamuya a├ž─▒k de─čildir ve sonu├žlar performans de─čerlendirmesi i├žin COCO de─čerlendirme sunucusuna g├Ânderilir.

Uygulamalar

COCO-Pose veri k├╝mesi ├Âzellikle OpenPose gibi anahtar nokta tespiti ve poz tahmini g├Ârevlerinde derin ├Â─črenme modellerini e─čitmek ve de─čerlendirmek i├žin kullan─▒l─▒r. Veri setinin ├žok say─▒da a├ž─▒klamal─▒ g├Âr├╝nt├╝s├╝ ve standartla┼čt─▒r─▒lm─▒┼č de─čerlendirme metrikleri, onu poz tahminine odaklanan bilgisayarla g├Ârme ara┼čt─▒rmac─▒lar─▒ ve uygulay─▒c─▒lar─▒ i├žin ├Ânemli bir kaynak haline getirmektedir.

Veri K├╝mesi YAML

Veri k├╝mesi yap─▒land─▒rmas─▒n─▒ tan─▒mlamak i├žin bir YAML (Yet Another Markup Language) dosyas─▒ kullan─▒l─▒r. Veri k├╝mesinin yollar─▒, s─▒n─▒flar─▒ ve di─čer ilgili bilgiler hakk─▒nda bilgi i├žerir. COCO-Pose veri k├╝mesi s├Âz konusu oldu─čunda coco-pose.yaml dosyas─▒ ┼ču adreste tutulur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco-pose.yaml.

ultralytics/cfg/datasets/coco-pose.yaml

# Ultralytics YOLO ­čÜÇ, AGPL-3.0 license
# COCO 2017 dataset https://cocodataset.org by Microsoft
# Documentation: https://docs.ultralytics.com/datasets/pose/coco/
# Example usage: yolo train data=coco-pose.yaml
# parent
# ÔöťÔöÇÔöÇ ultralytics
# ÔööÔöÇÔöÇ datasets
#     ÔööÔöÇÔöÇ coco-pose  ÔćÉ downloads here (20.1 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco-pose # dataset root dir
train: train2017.txt # train images (relative to 'path') 118287 images
val: val2017.txt # val images (relative to 'path') 5000 images
test: test-dev2017.txt # 20288 of 40670 images, submit to https://competitions.codalab.org/competitions/20794

# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# Classes
names:
  0: person

# Download script/URL (optional)
download: |
  from ultralytics.utils.downloads import download
  from pathlib import Path

  # Download labels
  dir = Path(yaml['path'])  # dataset root dir
  url = 'https://github.com/ultralytics/yolov5/releases/download/v1.0/'
  urls = [url + 'coco2017labels-pose.zip']  # labels
  download(urls, dir=dir.parent)
  # Download data
  urls = ['http://images.cocodataset.org/zips/train2017.zip',  # 19G, 118k images
          'http://images.cocodataset.org/zips/val2017.zip',  # 1G, 5k images
          'http://images.cocodataset.org/zips/test2017.zip']  # 7G, 41k images (optional)
  download(urls, dir=dir / 'images', threads=3)

Kullan─▒m

Bir YOLOv8n-pose modelini COCO-Pose veri k├╝mesi ├╝zerinde 640 g├Âr├╝nt├╝ boyutuyla 100 epoch i├žin e─čitmek i├žin a┼ča─č─▒daki kod par├žac─▒klar─▒n─▒ kullanabilirsiniz. Kullan─▒labilir ba─č─▒ms─▒z de─či┼čkenlerin kapsaml─▒ bir listesi i├žin Model E─čitimi sayfas─▒na bak─▒n.

Tren ├ľrne─či

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=coco-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

├ľrnek G├Âr├╝nt├╝ler ve A├ž─▒klamalar

COCO-Pose veri k├╝mesi, insan fig├╝rlerinin anahtar noktalarla a├ž─▒kland─▒─č─▒ ├že┼čitli g├Âr├╝nt├╝ler i├žerir. A┼ča─č─▒da veri k├╝mesinden baz─▒ g├Âr├╝nt├╝ ├Ârnekleri ve bunlara kar┼č─▒l─▒k gelen ek a├ž─▒klamalar yer almaktad─▒r:

Veri k├╝mesi ├Ârnek g├Âr├╝nt├╝s├╝

  • Mozaiklenmi┼č G├Âr├╝nt├╝: Bu g├Âr├╝nt├╝, mozaiklenmi┼č veri k├╝mesi g├Âr├╝nt├╝lerinden olu┼čan bir e─čitim grubunu g├Âstermektedir. Mozaikleme, e─čitim s─▒ras─▒nda kullan─▒lan ve her bir e─čitim grubundaki nesne ve sahne ├že┼čitlili─čini art─▒rmak i├žin birden fazla g├Âr├╝nt├╝y├╝ tek bir g├Âr├╝nt├╝de birle┼čtiren bir tekniktir. Bu, modelin farkl─▒ nesne boyutlar─▒na, en boy oranlar─▒na ve ba─člamlara genelleme yetene─čini geli┼čtirmeye yard─▒mc─▒ olur.

Bu ├Ârnek, COCO-Pose veri setindeki g├Âr├╝nt├╝lerin ├že┼čitlili─čini ve karma┼č─▒kl─▒─č─▒n─▒ ve e─čitim s├╝recinde mozaikleme kullanman─▒n faydalar─▒n─▒ g├Âstermektedir.

At─▒flar ve Te┼čekk├╝r

Ara┼čt─▒rma veya geli┼čtirme ├žal─▒┼čmalar─▒n─▒zda COCO-Pose veri setini kullan─▒yorsan─▒z, l├╝tfen a┼ča─č─▒daki makaleye at─▒fta bulunun:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Bilgisayarla g├Ârme toplulu─ču i├žin bu de─čerli kayna─č─▒ yaratan ve s├╝rd├╝ren COCO Konsorsiyumu'na te┼čekk├╝r ederiz. COCO-Pose veri seti ve yarat─▒c─▒lar─▒ hakk─▒nda daha fazla bilgi i├žin COCO veri seti web sitesini ziyaret edin.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6), RizwanMunawar (1), Laughing-q (1)

Yorumlar