COCO128 Veri Kümesi

Giriş

Ultralytics COCO128, COCO train 2017 setinin ilk 128 görüntüsünden oluşan küçük ama çok yönlü bir nesne algılama veri kümesidir. Bu veri kümesi, nesne algılama modellerini test etmek ve hatalarını ayıklamak veya yeni algılama yaklaşımlarını denemek için idealdir. 128 görüntü ile kolayca yönetilebilecek kadar küçüktür, ancak daha büyük veri kümelerini eğitmeden önce hatalar için eğitim ardışık düzenlerini test etmek ve bir akıl sağlığı kontrolü görevi görmek için yeterince çeşitlidir.

İzle: Ultralytics COCO Veri Setine Genel Bakış

Bu veri kümesi, Ultralytics Platform ve YOLO26 ile kullanılmak üzere tasarlanmıştır.

Veri Seti YAML

YAML (Yet Another Markup Language) dosyası, veri kümesi yapılandırmasını tanımlamak için kullanılır. Veri kümesinin yolları, sınıfları ve diğer ilgili bilgiler hakkında bilgi içerir. COCO128 veri kümesi söz konusu olduğunda, coco128.yaml dosyası şu adreste tutulur: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128.yaml.

ultralytics/cfg/datasets/coco128.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO128 dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco/
# Example usage: yolo train data=coco128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco128 ← downloads here (7 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco128 # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128.zip

Kullanım

COCO128 veri kümesinde 640 görüntü boyutuyla 100 epoch boyunca bir YOLO26n modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Mevcut argümanların kapsamlı bir listesi için model Eğitim sayfasına bakın.

Eğitim Örneği

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo detect train data=coco128.yaml model=yolo26n.pt epochs=100 imgsz=640

Örnek Görüntüler ve Açıklamalar

İşte COCO128 veri kümesinden bazı görüntü örnekleri ve bunlara karşılık gelen açıklamaları:

COCO128 algılama veri kümesi mozaik eğitim partisi

Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri seti görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, her eğitim grubundaki nesnelerin ve sahnelerin çeşitliliğini artırmak için birden çok görüntüyü tek bir görüntüde birleştiren eğitim sırasında kullanılan bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.

Bu örnek, COCO128 veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaiklemenin kullanımının faydalarını sergilemektedir.

Alıntılar ve Teşekkürler

Araştırma veya geliştirme çalışmalarınızda COCO veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:

BibTeX

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Bilgisayar görüşü topluluğu için bu değerli kaynağı oluşturdukları ve sürdürdükleri için COCO Konsorsiyumu'na teşekkür etmek isteriz. COCO veri seti ve yaratıcıları hakkında daha fazla bilgi için COCO veri seti web sitesini ziyaret edin.

SSS

Ultralytics COCO128 veri seti ne için kullanılır?

Ultralytics COCO128 veri kümesi, COCO train 2017 veri kümesinden alınan ilk 128 görüntüyü içeren kompakt bir alt kümedir. Öncelikle nesne algılama modellerini test etmek ve hatalarını ayıklamak, yeni algılama yaklaşımlarını denemek ve daha büyük veri kümelerine ölçeklemeden önce eğitim hatlarını doğrulamak için kullanılır. Yönetilebilir boyutu, anlamlı bir test durumu olmak için yeterli çeşitlilik sağlarken hızlı yinelemeler için mükemmeldir.

COCO128 veri kümesini kullanarak bir YOLO26 modeli nasıl eğitirim?

COCO128 veri kümesinde bir YOLO26 modeli eğitmek için python veya CLI komutlarını kullanabilirsiniz. İşte nasıl yapılacağı:

Eğitim Örneği

PythonCLI

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="coco128.yaml", epochs=100, imgsz=640)

yolo detect train data=coco128.yaml model=yolo26n.pt epochs=100 imgsz=640

Daha fazla eğitim seçeneği ve parametre için Eğitim dökümanlarına bakın.

COCO128 ile mozaik artırma kullanmanın faydaları nelerdir?

Mozaik artırma, sample_images'da gösterildiği gibi, birden fazla eğitim görüntüsünü tek birleşik bir görüntüde birleştirir. Bu teknik, COCO128 ile eğitim yaparken çeşitli avantajlar sunar:

Her eğitim grubundaki nesne ve bağlam çeşitliliğini artırır
Farklı nesne boyutları ve en boy oranlarında model genellemesini iyileştirir
Çeşitli ölçeklerdeki nesneler için algılama performansını artırır
Daha çeşitli eğitim örnekleri oluşturarak küçük bir veri kümesinin faydasını en üst düzeye çıkarır.

Bu teknik, modellerin sınırlı verilerden daha sağlam özellikler öğrenmesine yardımcı olarak COCO128 gibi daha küçük veri kümeleri için özellikle değerlidir.

COCO128, diğer COCO veri kümesi varyantlarıyla nasıl karşılaştırılır?

COCO128 (128 resim), boyut olarak COCO8 (8 resim) ile tam COCO veri kümesi (118K+ resim) arasında yer alır:

COCO8: Sadece 8 görüntü içerir (4 eğitim, 4 doğrulama) - hızlı testler ve hata ayıklama için idealdir
COCO128: Boyut ve çeşitlilik arasında dengelenmiş 128 görüntü içerir
Tam COCO: 118K+'dan fazla eğitim görüntüsü içerir - kapsamlı ancak kaynak yoğundur

COCO128, COCO8'den daha fazla çeşitlilik sunarken, tam COCO veri kümesine göre deney ve ilk model geliştirme için çok daha yönetilebilir kalarak iyi bir orta yol sağlar.

COCO128'i nesne algılama dışındaki görevler için kullanabilir miyim?

COCO128 öncelikle nesne algılama için tasarlanmış olsa da, veri kümesinin açıklamaları diğer bilgisayar görüşü görevleri için uyarlanabilir:

Örnek segmentasyonu: Açıklamalarda sağlanan segmentasyon maskelerini kullanarak
Anahtar nokta tespiti: Anahtar nokta ek açıklamaları içeren insanlar içeren resimler için
Transfer öğrenimi: Özel görevler için modellere ince ayar yapmaya başlamak için bir başlangıç noktası olarak

Segmentasyon gibi özel görevler için, uygun açıklamaları içeren COCO8-seg gibi amaca yönelik varyantları kullanmayı düşünebilirsiniz.

📅 11 ay önce oluşturuldu ✏️ 1 ay önce güncellendi