COCO-Seg Veri Kümesi

COCO-Seg veri kümesi, COCO (Common Objects in Context) veri kümesinin bir uzantısı olup, örnek bölümleme alanındaki araştırmalara yardımcı olmak için özel olarak tasarlanmıştır. COCO ile aynı görüntüleri kullanır ancak daha detaylı bölümleme açıklamaları sunar. Bu veri kümesi, özellikle Ultralytics YOLO modellerini eğitmek üzere örnek bölümleme görevleri üzerinde çalışan araştırmacılar ve geliştiriciler için kritik bir kaynaktır.

COCO-Seg Önceden Eğitilmiş Modelleri

Modelboyut
(piksel)
mAPbox
50-95(e2e)
mAPmask
50-95(e2e)
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO26n-seg64039.633.953.3 ± 0.52.1 ± 0.02.79.1
YOLO26s-seg64047.340.0118.4 ± 0.93.3 ± 0.010.434.2
YOLO26m-seg64052.544.1328.2 ± 2.46.7 ± 0.123.6121.5
YOLO26l-seg64054.445.5387.0 ± 3.78.0 ± 0.128.0139.8
YOLO26x-seg64056.547.0787.0 ± 6.816.4 ± 0.162.8313.5

Temel Özellikler

  • COCO-Seg, COCO'daki orijinal 330 bin görüntüyü korur.
  • Veri kümesi, orijinal COCO veri kümesinde bulunan aynı 80 nesne kategorisinden oluşur.
  • Açıklamalar artık görüntülerdeki her nesne için daha detaylı örnek bölümleme maskeleri içerir.
  • COCO-Seg, nesne algılama için ortalama Ortalama Hassasiyet (mAP) ve örnek bölümleme görevleri için ortalama Ortalama Geri Çağırma (mAR) gibi standartlaştırılmış değerlendirme metrikleri sunarak model performansının etkin bir şekilde karşılaştırılmasını sağlar.

Veri Kümesi Yapısı

COCO-Seg veri kümesi üç alt kümeye ayrılmıştır:

  1. Train2017: Örnek bölümleme modellerini eğitmek için 118 bin görüntü.
  2. Val2017: Model geliştirme sırasında doğrulama için kullanılan 5 bin görüntü.
  3. Test2017: Kıyaslama için kullanılan 20 bin görüntü. Bu alt küme için temel gerçeklik açıklamaları halka açık değildir, bu nedenle tahminlerin puanlanması için COCO değerlendirme sunucusuna gönderilmesi gerekir.

Uygulamalar

COCO-Seg, YOLO modelleri gibi derin öğrenme modellerinin eğitilmesi ve değerlendirilmesi için yaygın olarak kullanılır. Çok sayıda açıklamalı görüntü, nesne kategorilerinin çeşitliliği ve standartlaştırılmış değerlendirme metrikleri, onu bilgisayarlı görü araştırmacıları ve uygulayıcıları için vazgeçilmez bir kaynak haline getirir.

Veri Kümesi YAML Dosyası

Veri kümesi yapılandırmasını tanımlamak için bir YAML (Yet Another Markup Language) dosyası kullanılır. Bu dosya, veri kümesinin yolları, sınıfları ve diğer ilgili bilgileri hakkında bilgiler içerir. COCO-Seg veri kümesi durumunda, coco.yaml dosyası https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco.yaml adresinde tutulmaktadır.

ultralytics/cfg/datasets/coco.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO 2017 dataset https://cocodataset.org by Microsoft
# Documentation: https://docs.ultralytics.com/datasets/detect/coco/
# Example usage: yolo train data=coco.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco ← downloads here (20.1 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco # dataset root dir
train: train2017.txt # train images (relative to 'path') 118287 images
val: val2017.txt # val images (relative to 'path') 5000 images
test: test-dev2017.txt # 20288 of 40670 images, submit to https://competitions.codalab.org/competitions/20794

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: |
  from pathlib import Path

  from ultralytics.utils import ASSETS_URL
  from ultralytics.utils.downloads import download

  # Download labels
  segments = True  # segment or box labels
  dir = Path(yaml["path"])  # dataset root dir
  urls = [ASSETS_URL + ("/coco2017labels-segments.zip" if segments else "/coco2017labels.zip")]  # labels
  download(urls, dir=dir.parent)
  # Download data
  urls = [
      "http://images.cocodataset.org/zips/train2017.zip",  # 19G, 118k images
      "http://images.cocodataset.org/zips/val2017.zip",  # 1G, 5k images
      "http://images.cocodataset.org/zips/test2017.zip",  # 7G, 41k images (optional)
  ]
  download(urls, dir=dir / "images", threads=3)

Kullanım

COCO-Seg veri kümesi üzerinde 100 dönem boyunca 640 görüntü boyutuyla bir YOLO26n-seg modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsin. Mevcut argümanların kapsamlı bir listesi için Eğitim modeli sayfasına bakabilirsin.

Eğitim Örneği
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco.yaml", epochs=100, imgsz=640)

Örnek Görüntüler ve Ek Açıklamalar

COCO-Seg, selefi COCO gibi, çeşitli nesne kategorilerine ve karmaşık sahnelere sahip çeşitli görüntüler içerir. Ancak COCO-Seg, görüntülerdeki her nesne için daha detaylı örnek bölümleme maskeleri sunar. İşte veri kümesinden bazı görüntüler ve bunlara karşılık gelen örnek bölümleme maskeleri örnekleri:

COCO bölümleme veri kümesi mozaiği eğitim grubu

  • Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri kümesi görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, her eğitim grubu içindeki nesne ve sahne çeşitliliğini artırmak için birden fazla görüntüyü tek bir görüntüde birleştiren, eğitim sırasında kullanılan bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yapma yeteneğine yardımcı olur.

Örnek, COCO-Seg veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaikleme kullanmanın avantajlarını sergilemektedir.

Alıntılar ve Teşekkür

COCO-Seg veri kümesini araştırma veya geliştirme çalışmalarında kullanırsan, lütfen orijinal COCO makalesine atıfta bulun ve COCO-Seg'e yapılan uzantıyı belirt:

Alıntı
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Bilgisayarlı görü topluluğu için bu paha biçilmez kaynağı yarattıkları ve sürdürdükleri için COCO Konsorsiyumu'na teşekkürlerimizi sunarız. COCO veri kümesi ve yaratıcıları hakkında daha fazla bilgi için COCO veri kümesi web sitesini ziyaret et.

SSS

COCO-Seg veri kümesi nedir ve orijinal COCO veri kümesinden farkı nedir?

COCO-Seg veri kümesi, özellikle örnek bölümleme görevleri için tasarlanmış orijinal COCO (Common Objects in Context) veri kümesinin bir uzantısıdır. COCO veri kümesiyle aynı görüntüleri kullansa da, COCO-Seg daha detaylı bölümleme açıklamaları içerir ve bu da onu nesne örnek bölümleme üzerine odaklanan araştırmacılar ve geliştiriciler için güçlü bir kaynak haline getirir.

COCO-Seg veri kümesini kullanarak nasıl YOLO26 modeli eğitebilirim?

COCO-Seg veri kümesi üzerinde 100 dönem boyunca 640 görüntü boyutuyla bir YOLO26n-seg modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsin. Mevcut argümanların detaylı bir listesi için Eğitim modeli sayfasına bakabilirsin.

Eğitim Örneği
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco.yaml", epochs=100, imgsz=640)

COCO-Seg veri kümesinin temel özellikleri nelerdir?

COCO-Seg veri kümesi birkaç temel özellik içerir:

  • COCO veri kümesindeki orijinal 330 bin görüntüyü korur.
  • Orijinal COCO'da bulunan aynı 80 nesne kategorisini açıklar.
  • Her nesne için daha detaylı örnek bölümleme maskeleri sağlar.
  • Uses standardized evaluation metrics such as mean Average Precision (mAP) for object detection and mean Average Recall (mAR) for instance segmentation tasks.

COCO-Seg için hangi önceden eğitilmiş modeller mevcuttur ve performans metrikleri nelerdir?

COCO-Seg veri kümesi, değişen performans metriklerine sahip birden fazla önceden eğitilmiş YOLO26 bölümleme modelini destekler. İşte mevcut modellerin ve temel metriklerinin bir özeti:

Modelboyut
(piksel)
mAPbox
50-95(e2e)
mAPmask
50-95(e2e)
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO26n-seg64039.633.953.3 ± 0.52.1 ± 0.02.79.1
YOLO26s-seg64047.340.0118.4 ± 0.93.3 ± 0.010.434.2
YOLO26m-seg64052.544.1328.2 ± 2.46.7 ± 0.123.6121.5
YOLO26l-seg64054.445.5387.0 ± 3.78.0 ± 0.128.0139.8
YOLO26x-seg64056.547.0787.0 ± 6.816.4 ± 0.162.8313.5

Bu modeller, hafif YOLO26n-seg'den daha güçlü YOLO26x-seg'e kadar çeşitlilik gösterir ve çeşitli uygulama gereksinimlerine uyacak şekilde hız ve doğruluk arasında farklı dengeler sunar. Model seçimi hakkında daha fazla bilgi için Ultralytics modeller sayfası kısmını ziyaret et.

COCO-Seg veri kümesi nasıl yapılandırılmıştır ve hangi alt kümeleri içerir?

COCO-Seg veri kümesi, belirli eğitim ve değerlendirme ihtiyaçları için üç alt kümeye ayrılmıştır:

  1. Train2017: Öncelikle örnek bölümleme modellerini eğitmek için kullanılan 118 bin görüntü içerir.
  2. Val2017: Eğitim süreci sırasında doğrulama için kullanılan 5 bin görüntüden oluşur.
  3. Test2017: Eğitilmiş modelleri test etmek ve kıyaslamak için ayrılmış 20 bin görüntü içerir. Bu alt küme için temel gerçeklik açıklamalarının halka açık olmadığını ve performans sonuçlarının değerlendirme için COCO değerlendirme sunucusuna gönderildiğini unutma.

Daha küçük deney ihtiyaçları için, COCO train 2017 setinden sadece 8 görüntü içeren kompakt bir sürüm olan COCO8-seg veri kümesini kullanmayı da düşünebilirsin.

Yorumlar