İçeriğe geç

COCO128 Veri Kümesi

Giriş

Ultralytics COCO128, COCO train 2017 setinin ilk 128 görüntüsünden oluşan küçük ama çok yönlü bir nesne alg ılama veri kümesidir. Bu veri kümesi, nesne algılama modellerini test etmek ve hata ayıklamak ya da yeni algılama yaklaşımlarını denemek için idealdir. 128 görüntü ile kolayca yönetilebilecek kadar küçüktür, ancak eğitim boru hatlarını hatalara karşı test etmek ve daha büyük veri kümelerini eğitmeden önce bir sağlık kontrolü görevi görecek kadar çeşitlidir.



İzle: Ultralytics COCO Veri Setine Genel Bakış

Bu veri seti Ultralytics HUB ile kullanılmak üzere tasarlanmıştır ve YOLO11.

Veri Kümesi YAML

Veri kümesi yapılandırmasını tanımlamak için bir YAML (Yet Another Markup Language) dosyası kullanılır. Veri kümesinin yolları, sınıfları ve diğer ilgili bilgiler hakkında bilgi içerir. COCO128 veri kümesi söz konusu olduğunda coco128.yaml dosyası şu adreste tutulur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128.yaml.

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO128 dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco/
# Example usage: yolo train data=coco128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco128  ← downloads here (7 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco128 # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128.zip

Kullanım

Bir YOLO11n modelini COCO128 veri kümesi üzerinde 640 görüntü boyutuyla 100 epok için eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=coco128.yaml model=yolo11n.pt epochs=100 imgsz=640

Örnek Görüntüler ve Açıklamalar

COCO128 veri kümesinden bazı görüntü örnekleri ve bunlara karşılık gelen ek açıklamalar aşağıda verilmiştir:

Veri kümesi örnek görüntüsü

  • Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri kümesi görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, eğitim sırasında kullanılan ve her bir eğitim grubundaki nesne ve sahne çeşitliliğini artırmak için birden fazla görüntüyü tek bir görüntüde birleştiren bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.

Bu örnek, COCO128 veri setindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaikleme kullanmanın faydalarını göstermektedir.

Atıflar ve Teşekkür

Araştırma veya geliştirme çalışmalarınızda COCO veri setini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Bilgisayarla görme topluluğu için bu değerli kaynağı yaratan ve sürdüren COCO Konsorsiyumu'na teşekkür ederiz. COCO veri seti ve yaratıcıları hakkında daha fazla bilgi için COCO veri seti web sitesini ziyaret edin.

SSS

Ultralytics COCO128 veri seti ne için kullanılır?

Ultralytics COCO128 veri kümesi, COCO train 2017 veri kümesinden ilk 128 görüntüyü içeren kompakt bir alt kümedir. Öncelikle nesne alg ılama modellerini test etmek ve hata ayıklamak, yeni algılama yaklaşımlarını denemek ve daha büyük veri kümelerine ölçeklendirmeden önce eğitim boru hatlarını doğrulamak için kullanılır. Yönetilebilir boyutu, hızlı yinelemeler için mükemmel olmasını sağlarken, anlamlı bir test örneği olmak için yeterli çeşitlilik sağlar.

COCO128 veri kümesini kullanarak bir YOLO11 modelini nasıl eğitebilirim?

COCO128 veri kümesi üzerinde bir YOLO11 modelini eğitmek için Python veya CLI komutlarını kullanabilirsiniz. İşte nasıl yapılacağı:

Tren Örneği

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco128.yaml", epochs=100, imgsz=640)
yolo detect train data=coco128.yaml model=yolo11n.pt epochs=100 imgsz=640

Daha fazla eğitim seçeneği ve parametresi için Eğitim belgelerine bakın.

COCO128 ile mozaik büyütme kullanmanın faydaları nelerdir?

Örnek görüntülerde gösterildiği gibi mozaik büyütme, birden fazla eğitim görüntüsünü tek bir kompozit görüntüde birleştirir. Bu teknik, COCO128 ile eğitim yaparken çeşitli avantajlar sunar:

  • Her bir eğitim grubundaki nesnelerin ve bağlamların çeşitliliğini artırır
  • Farklı nesne boyutları ve en boy oranları arasında model genellemesini geliştirir
  • Çeşitli ölçeklerdeki nesneler için algılama performansını artırır
  • Daha çeşitli eğitim örnekleri oluşturarak küçük bir veri kümesinin faydasını en üst düzeye çıkarır

Bu teknik özellikle COCO128 gibi daha küçük veri kümeleri için değerlidir ve modellerin sınırlı verilerden daha sağlam özellikler öğrenmesine yardımcı olur.

COCO128 diğer COCO veri seti varyantlarıyla nasıl karşılaştırılır?

COCO128 (128 görüntü), boyut açısından COCO8 (8 görüntü) ile tam COCO veri seti (118K+ görüntü) arasında yer almaktadır:

  • COCO8: Sadece 8 görüntü içerir (4 tren, 4 val) - hızlı testler ve hata ayıklama için idealdir
  • COCO128: 128 görüntü içerir - boyut ve çeşitlilik arasında dengeli
  • Tam COCO: 118K+ eğitim görüntüsü içerir - kapsamlı ancak yoğun kaynak gerektirir

COCO128, COCO8'den daha fazla çeşitlilik sunarken, deney ve ilk model geliştirme için tam COCO veri setinden çok daha yönetilebilir kalarak iyi bir orta yol sağlar.

COCO128'i nesne algılama dışındaki görevler için kullanabilir miyim?

COCO128 öncelikle nesne algılama için tasarlanmış olsa da, veri kümesinin açıklamaları diğer bilgisayarla görme görevleri için uyarlanabilir:

  • Örnek segmentasyonu: Ek açıklamalarda sağlanan segmentasyon maskelerini kullanma
  • Anahtar nokta tespiti: Anahtar nokta ek açıklamaları olan kişileri içeren görüntüler için
  • Transfer öğrenimi: Özel görevler için modellere ince ayar yapmak üzere bir başlangıç noktası olarak

Segmentasyon gibi özel görevler için, uygun ek açıklamaları içeren COCO8-seg gibi amaca yönelik oluşturulmuş varyantları kullanmayı düşünün.

📅1 ay önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar