COCO128 Veri Kümesi
Giriş
Ultralytics COCO128, COCO train 2017 setinin ilk 128 görüntüsünden oluşan küçük ama çok yönlü bir nesne alg ılama veri kümesidir. Bu veri kümesi, nesne algılama modellerini test etmek ve hata ayıklamak ya da yeni algılama yaklaşımlarını denemek için idealdir. 128 görüntü ile kolayca yönetilebilecek kadar küçüktür, ancak eğitim boru hatlarını hatalara karşı test etmek ve daha büyük veri kümelerini eğitmeden önce bir sağlık kontrolü görevi görecek kadar çeşitlidir.
İzle: Ultralytics COCO Veri Setine Genel Bakış
Bu veri seti Ultralytics HUB ile kullanılmak üzere tasarlanmıştır ve YOLO11.
Veri Kümesi YAML
Veri kümesi yapılandırmasını tanımlamak için bir YAML (Yet Another Markup Language) dosyası kullanılır. Veri kümesinin yolları, sınıfları ve diğer ilgili bilgiler hakkında bilgi içerir. COCO128 veri kümesi söz konusu olduğunda coco128.yaml
dosyası şu adreste tutulur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128.yaml.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO128 dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco/
# Example usage: yolo train data=coco128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco128 ← downloads here (7 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco128 # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128.zip
Kullanım
Bir YOLO11n modelini COCO128 veri kümesi üzerinde 640 görüntü boyutuyla 100 epok için eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.
Tren Örneği
Örnek Görüntüler ve Açıklamalar
COCO128 veri kümesinden bazı görüntü örnekleri ve bunlara karşılık gelen ek açıklamalar aşağıda verilmiştir:
- Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri kümesi görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, eğitim sırasında kullanılan ve her bir eğitim grubundaki nesne ve sahne çeşitliliğini artırmak için birden fazla görüntüyü tek bir görüntüde birleştiren bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.
Bu örnek, COCO128 veri setindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaikleme kullanmanın faydalarını göstermektedir.
Atıflar ve Teşekkür
Araştırma veya geliştirme çalışmalarınızda COCO veri setini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Bilgisayarla görme topluluğu için bu değerli kaynağı yaratan ve sürdüren COCO Konsorsiyumu'na teşekkür ederiz. COCO veri seti ve yaratıcıları hakkında daha fazla bilgi için COCO veri seti web sitesini ziyaret edin.
SSS
Ultralytics COCO128 veri seti ne için kullanılır?
Ultralytics COCO128 veri kümesi, COCO train 2017 veri kümesinden ilk 128 görüntüyü içeren kompakt bir alt kümedir. Öncelikle nesne alg ılama modellerini test etmek ve hata ayıklamak, yeni algılama yaklaşımlarını denemek ve daha büyük veri kümelerine ölçeklendirmeden önce eğitim boru hatlarını doğrulamak için kullanılır. Yönetilebilir boyutu, hızlı yinelemeler için mükemmel olmasını sağlarken, anlamlı bir test örneği olmak için yeterli çeşitlilik sağlar.
COCO128 veri kümesini kullanarak bir YOLO11 modelini nasıl eğitebilirim?
COCO128 veri kümesi üzerinde bir YOLO11 modelini eğitmek için Python veya CLI komutlarını kullanabilirsiniz. İşte nasıl yapılacağı:
Tren Örneği
Daha fazla eğitim seçeneği ve parametresi için Eğitim belgelerine bakın.
COCO128 ile mozaik büyütme kullanmanın faydaları nelerdir?
Örnek görüntülerde gösterildiği gibi mozaik büyütme, birden fazla eğitim görüntüsünü tek bir kompozit görüntüde birleştirir. Bu teknik, COCO128 ile eğitim yaparken çeşitli avantajlar sunar:
- Her bir eğitim grubundaki nesnelerin ve bağlamların çeşitliliğini artırır
- Farklı nesne boyutları ve en boy oranları arasında model genellemesini geliştirir
- Çeşitli ölçeklerdeki nesneler için algılama performansını artırır
- Daha çeşitli eğitim örnekleri oluşturarak küçük bir veri kümesinin faydasını en üst düzeye çıkarır
Bu teknik özellikle COCO128 gibi daha küçük veri kümeleri için değerlidir ve modellerin sınırlı verilerden daha sağlam özellikler öğrenmesine yardımcı olur.
COCO128 diğer COCO veri seti varyantlarıyla nasıl karşılaştırılır?
COCO128 (128 görüntü), boyut açısından COCO8 (8 görüntü) ile tam COCO veri seti (118K+ görüntü) arasında yer almaktadır:
- COCO8: Sadece 8 görüntü içerir (4 tren, 4 val) - hızlı testler ve hata ayıklama için idealdir
- COCO128: 128 görüntü içerir - boyut ve çeşitlilik arasında dengeli
- Tam COCO: 118K+ eğitim görüntüsü içerir - kapsamlı ancak yoğun kaynak gerektirir
COCO128, COCO8'den daha fazla çeşitlilik sunarken, deney ve ilk model geliştirme için tam COCO veri setinden çok daha yönetilebilir kalarak iyi bir orta yol sağlar.
COCO128'i nesne algılama dışındaki görevler için kullanabilir miyim?
COCO128 öncelikle nesne algılama için tasarlanmış olsa da, veri kümesinin açıklamaları diğer bilgisayarla görme görevleri için uyarlanabilir:
- Örnek segmentasyonu: Ek açıklamalarda sağlanan segmentasyon maskelerini kullanma
- Anahtar nokta tespiti: Anahtar nokta ek açıklamaları olan kişileri içeren görüntüler için
- Transfer öğrenimi: Özel görevler için modellere ince ayar yapmak üzere bir başlangıç noktası olarak
Segmentasyon gibi özel görevler için, uygun ek açıklamaları içeren COCO8-seg gibi amaca yönelik oluşturulmuş varyantları kullanmayı düşünün.