COCO Veri Seti

COCO (Common Objects in Context - Bağlam İçindeki Yaygın Nesneler) veri seti, büyük ölçekli bir nesne algılama, bölütleme ve altyazı oluşturma veri setidir. Çok çeşitli nesne kategorilerinde araştırmayı teşvik etmek için tasarlanmıştır ve bilgisayarlı görü modellerini kıyaslamak için yaygın olarak kullanılır. Nesne algılama, bölütleme ve duruş tahmini görevleri üzerinde çalışan araştırmacılar ve geliştiriciler için temel bir veri setidir.



Watch: Ultralytics COCO Dataset Overview

COCO Önceden Eğitilmiş Modelleri

Modelboyut
(piksel)
mAPval
50-95
mAPval
50-95(e2e)
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

Temel Özellikler

  • COCO, nesne algılama, bölütleme ve altyazı oluşturma görevleri için açıklamaları bulunan 200 bin görüntü dahil olmak üzere toplam 330 bin görüntü içerir.
  • Veri seti; arabalar, bisikletler ve hayvanlar gibi yaygın nesnelerin yanı sıra şemsiyeler, el çantaları ve spor ekipmanları gibi daha özel kategoriler dahil olmak üzere 80 nesne kategorisinden oluşur.
  • Açıklamalar, her görüntü için nesne sınırlayıcı kutularını, bölütleme maskelerini ve altyazıları içerir.
  • COCO; nesne algılama için ortalama Hassasiyet (mAP) ve bölütleme görevleri için ortalama Anımsama (mAR) gibi standartlaştırılmış değerlendirme metrikleri sunar, bu da onu model performansını karşılaştırmak için uygun hale getirir.

Veri Kümesi Yapısı

COCO veri seti üç alt kümeye ayrılmıştır:

  1. Train2017: Bu alt küme, nesne algılama, bölütleme ve altyazı oluşturma modellerini eğitmek için 118 bin görüntü içerir.
  2. Val2017: Bu alt küme, model eğitimi sırasında doğrulama amacıyla kullanılan 5 bin görüntüye sahiptir.
  3. Test2017: Bu alt küme, eğitilmiş modelleri test etmek ve kıyaslamak için kullanılan 20 bin görüntüden oluşur. Bu alt küme için temel doğruluk açıklamaları herkese açık değildir ve sonuçlar performans değerlendirmesi için COCO değerlendirme sunucusuna gönderilir.

Uygulamalar

The COCO dataset is widely used for training and evaluating deep learning models in object detection (such as Ultralytics YOLO, Faster R-CNN, and SSD), instance segmentation (such as Mask R-CNN), and keypoint detection (such as OpenPose). The dataset's diverse set of object categories, large number of annotated images, and standardized evaluation metrics make it an essential resource for computer vision researchers and practitioners.

Veri Kümesi YAML Dosyası

Veri seti yapılandırmasını tanımlamak için bir YAML (Yet Another Markup Language) dosyası kullanılır. Bu dosya, veri setinin yolları, sınıfları ve diğer ilgili bilgiler hakkında veriler içerir. COCO veri seti söz konusu olduğunda, coco.yaml dosyası https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco.yaml adresinde tutulmaktadır.

ultralytics/cfg/datasets/coco.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO 2017 dataset https://cocodataset.org by Microsoft
# Documentation: https://docs.ultralytics.com/datasets/detect/coco/
# Example usage: yolo train data=coco.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco ← downloads here (20.1 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco # dataset root dir
train: train2017.txt # train images (relative to 'path') 118287 images
val: val2017.txt # val images (relative to 'path') 5000 images
test: test-dev2017.txt # 20288 of 40670 images, submit to https://competitions.codalab.org/competitions/20794

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: |
  from pathlib import Path

  from ultralytics.utils import ASSETS_URL
  from ultralytics.utils.downloads import download

  # Download labels
  segments = True  # segment or box labels
  dir = Path(yaml["path"])  # dataset root dir
  urls = [ASSETS_URL + ("/coco2017labels-segments.zip" if segments else "/coco2017labels.zip")]  # labels
  download(urls, dir=dir.parent)
  # Download data
  urls = [
      "http://images.cocodataset.org/zips/train2017.zip",  # 19G, 118k images
      "http://images.cocodataset.org/zips/val2017.zip",  # 1G, 5k images
      "http://images.cocodataset.org/zips/test2017.zip",  # 7G, 41k images (optional)
  ]
  download(urls, dir=dir / "images", threads=3)

Kullanım

Bir YOLO26n modelini COCO veri setinde 640 görüntü boyutuyla 100 dönem (epoch) boyunca eğitmek için aşağıdaki kod parçacıklarını kullanabilirsin. Mevcut argümanların kapsamlı bir listesi için Eğitim sayfası modeline başvur.

Eğitim Örneği
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco.yaml", epochs=100, imgsz=640)

Örnek Görüntüler ve Ek Açıklamalar

COCO veri seti, çeşitli nesne kategorileri ve karmaşık sahneler içeren çok çeşitli görüntüler içerir. İşte veri setinden bazı görüntü örnekleri ve bunlara karşılık gelen açıklamalar:

COCO veri seti mozaik eğitim grubu ile nesne algılama

  • Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri seti görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, eğitim sırasında her eğitim grubundaki nesne ve sahne çeşitliliğini artırmak için birden fazla görüntüyü tek bir görüntüde birleştiren bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.

Bu örnek, COCO veri setindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaikleme kullanmanın faydalarını sergilemektedir.

Alıntılar ve Teşekkür

Araştırma veya geliştirme çalışmalarında COCO veri setini kullanırsan, lütfen aşağıdaki makaleye atıfta bulun:

Alıntı
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Bilgisayarlı görü topluluğu için bu değerli kaynağı oluşturdukları ve sürdürdükleri için COCO Konsorsiyumu'na teşekkür ederiz. COCO veri seti ve oluşturucuları hakkında daha fazla bilgi için COCO veri seti web sitesini ziyaret et.

SSS

COCO veri seti nedir ve bilgisayarlı görü için neden önemlidir?

COCO veri seti (Common Objects in Context), nesne algılama, bölütleme ve altyazı oluşturma için kullanılan büyük ölçekli bir veri setidir. 80 nesne kategorisi için ayrıntılı açıklamalar içeren 330 bin görüntü içerir, bu da onu bilgisayarlı görü modellerini kıyaslamak ve eğitmek için temel hale getirir. Araştırmacılar, çeşitli kategorileri ve ortalama Hassasiyet (mAP) gibi standartlaştırılmış değerlendirme metrikleri nedeniyle COCO'yu kullanırlar.

COCO veri setini kullanarak nasıl YOLO modeli eğitebilirim?

COCO veri setini kullanarak bir YOLO26 modelini eğitmek için şu kod parçacıklarını kullanabilirsin:

Eğitim Örneği
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco.yaml", epochs=100, imgsz=640)

Mevcut argümanlar hakkında daha fazla ayrıntı için Eğitim sayfasına bak.

COCO veri setinin temel özellikleri nelerdir?

COCO veri seti şunları içerir:

  • Nesne algılama, bölütleme ve altyazı oluşturma için açıklamaları yapılmış 200 bin görüntü dahil 330 bin görüntü.
  • Araba ve hayvan gibi yaygın öğelerden el çantası ve spor ekipmanı gibi özel öğelere kadar değişen 80 nesne kategorisi.
  • Nesne algılama (mAP) ve bölütleme (ortalama Anımsama, mAR) için standartlaştırılmış değerlendirme metrikleri.
  • Modelin çeşitli nesne boyutları ve bağlamlarda genellemesini geliştirmek için eğitim gruplarında Mozaikleme tekniği.

COCO veri setinde eğitilmiş YOLO26 modellerini nerede bulabilirim?

COCO veri setinde önceden eğitilmiş YOLO26 modelleri, belgelerde verilen bağlantılardan indirilebilir. Örnekler şunları içerir:

Bu modeller boyut, mAP ve çıkarım hızı açısından farklılık göstererek çeşitli performans ve kaynak gereksinimleri için seçenekler sunar.

COCO veri seti nasıl yapılandırılmıştır ve onu nasıl kullanırım?

COCO veri seti üç alt kümeye ayrılmıştır:

  1. Train2017: Eğitim için 118 bin görüntü.
  2. Val2017: Eğitim sırasında doğrulama için 5 bin görüntü.
  3. Test2017: Eğitilmiş modelleri kıyaslamak için 20 bin görüntü. Performans değerlendirmesi için sonuçların COCO değerlendirme sunucusuna gönderilmesi gerekir.

Veri setinin YAML yapılandırma dosyası, yolları, sınıfları ve veri seti ayrıntılarını tanımlayan coco.yaml adresinde mevcuttur.

Yorumlar