COCO12-Formats Veri Kümesi

Giriş

Ultralytics COCO12-Formats veri kümesi, desteklenen 12 görüntü formatı uzantısının tamamında görüntü yüklemeyi doğrulamak için tasarlanmış özel bir test veri kümesidir. Görüntü yükleme hattının kapsamlı bir şekilde test edilmesini sağlamak için her biri farklı bir formatta kaydedilmiş 12 görüntü (6'sı eğitim, 6'sı doğrulama için) içerir.

Bu veri kümesi şunlar için paha biçilmezdir:

  • Görüntü formatı desteğini test etme: Desteklenen tüm formatların doğru şekilde yüklendiğini doğrulayın
  • CI/CD hatları: Format uyumluluğunun otomatik olarak test edilmesi
  • Hata ayıklama: Eğitim hatlarındaki formata özgü sorunları izole etme
  • Geliştirme: Yeni format eklemelerini veya değişikliklerini doğrulama

Desteklenen Formatlar

Veri kümesi, ultralytics/data/utils.py içinde tanımlanan desteklenen 12 format uzantısının her biri için bir görüntü içerir:

FormatUzantıAçıklamaEğitim/Doğrulama
AVIF.avifAV1 Görüntü Dosyası Formatı (modern)Eğit (Train)
BMP.bmpBitmap - sıkıştırılmamış raster formatıEğit (Train)
DNG.dngDigital Negative - Adobe RAW formatıEğit (Train)
HEIC.heicYüksek Verimli Görüntü KodlamaEğit (Train)
JPEG.jpegTam uzantılı JPEGEğit (Train)
JPG.jpgKısa uzantılı JPEGEğit (Train)
JP2.jp2JPEG 2000 - tıbbi/coğrafiDoğrula (Val)
MPO.mpoÇoklu Resim Nesnesi (stereo görüntüler)Doğrula (Val)
PNG.pngTaşınabilir Ağ GrafikleriDoğrula (Val)
TIF.tifKısa uzantılı TIFFDoğrula (Val)
TIFF.tiffEtiketli Görüntü Dosyası FormatıDoğrula (Val)
WebP.webpModern web görüntü formatıDoğrula (Val)

Veri Kümesi Yapısı

coco12-formats/
├── images/
│   ├── train/          # 6 images (avif, bmp, dng, heic, jpeg, jpg)
│   └── val/            # 6 images (jp2, mpo, png, tif, tiff, webp)
├── labels/
│   ├── train/          # Corresponding YOLO format labels
│   └── val/
└── coco12-formats.yaml # Dataset configuration

Veri Kümesi YAML Dosyası

COCO12-Formats veri kümesi, veri kümesi yollarını ve sınıf adlarını tanımlayan bir YAML dosyası kullanılarak yapılandırılır. Resmi coco12-formats.yaml dosyasını Ultralytics GitHub deposunda inceleyebilirsin.

ultralytics/cfg/datasets/coco12-formats.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO12-Formats dataset (12 images testing all supported image formats) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco12-formats/
# Example usage: yolo train data=coco12-formats.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco12-formats ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco12-formats # dataset root dir
train: images/train # train images (relative to 'path') 6 images
val: images/val # val images (relative to 'path') 6 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco12-formats.zip

Gereksinimler

Bazı formatlar ek bağımlılıklar gerektirir:

pip install pillow pillow-heif pillow-avif-plugin

AVIF Sistem Kitaplığı (İsteğe bağlı)

OpenCV'nin AVIF dosyalarını doğrudan okuyabilmesi için, OpenCV derlenmeden önce libavif kurulmalıdır:

brew install libavif
Not

Pip ile kurulan opencv-python paketi önceden oluşturulmuş olduğundan AVIF desteğini içermeyebilir. Ultralytics, OpenCV'nin desteği olmadığında AVIF görüntüleri için bir yedek olarak pillow-avif-plugin ile Pillow kullanır.

Kullanım

COCO12-Formats veri kümesinde bir YOLO modeli eğitmek için şu örnekleri kullan:

Eğitim Örneği
from ultralytics import YOLO

# Load a pretrained YOLO model
model = YOLO("yolo26n.pt")

# Train on COCO12-Formats to test all image formats
results = model.train(data="coco12-formats.yaml", epochs=1, imgsz=640)

Formata Özel Notlar

AVIF (AV1 Görüntü Dosyası Formatı)

AVIF, mükemmel sıkıştırma sunan, AV1 video kodek tabanlı modern bir görüntü formatıdır. pillow-avif-plugin gerektirir:

pip install pillow-avif-plugin

DNG (Digital Negative)

DNG, Adobe'nin TIFF tabanlı açık RAW formatıdır. Test amaçlı olarak, veri kümesi .dng uzantılı TIFF tabanlı dosyalar kullanır.

JP2 (JPEG 2000)

JPEG 2000, geleneksel JPEG'den daha iyi sıkıştırma ve kalite sunan, dalgacık tabanlı bir görüntü sıkıştırma standardıdır. Tıbbi görüntüleme (DICOM), coğrafi uygulamalar ve dijital sinemada yaygın olarak kullanılır. Hem OpenCV hem de Pillow tarafından yerel olarak desteklenir.

MPO (Çoklu Resim Nesnesi)

MPO dosyaları stereoskopik (3D) görüntüler için kullanılır. Veri kümesi, format testi için .mpo uzantılı standart JPEG verilerini saklar.

HEIC (Yüksek Verimli Görüntü Kodlama)

HEIC, düzgün kodlama için pillow-heif paketini gerektirir:

pip install pillow-heif

Kullanım Durumları

CI/CD Testi

from ultralytics import YOLO

def test_all_image_formats():
    """Test that all image formats load correctly."""
    model = YOLO("yolo26n.pt")
    results = model.train(data="coco12-formats.yaml", epochs=1, imgsz=64)
    assert results is not None

Format Doğrulama

from pathlib import Path

from ultralytics.data.utils import IMG_FORMATS

# Verify all formats are represented
dataset_dir = Path("datasets/coco12-formats/images")
found_formats = {f.suffix[1:].lower() for f in dataset_dir.rglob("*.*")}
assert found_formats == IMG_FORMATS, f"Missing formats: {IMG_FORMATS - found_formats}"

Alıntılar ve Teşekkür

Araştırmanda COCO veri kümesini kullanıyorsan lütfen kaynak göster:

Alıntı
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Doll{\'a}r},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

SSS

COCO12-Formats Veri Kümesi Ne İçin Kullanılır?

COCO12-Formats veri kümesi, Ultralytics YOLO eğitim hatlarında görüntü formatı uyumluluğunu test etmek için tasarlanmıştır. Desteklenen 12 görüntü formatının (AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WebP) tamamının doğru şekilde yüklenmesini ve işlenmesini sağlar.

Neden Birden Fazla Görüntü Formatı Test Edilmeli?

Farklı görüntü formatları benzersiz özelliklere (sıkıştırma, bit derinliği, renk uzayları) sahiptir. Tüm formatları test etmek şunları sağlar:

  • Güçlü görüntü yükleme kodu
  • Çeşitli veri kümeleri arasında uyumluluk
  • Formata özgü hataların erken tespiti

Hangi Formatlar Özel Bağımlılıklar Gerektirir?

  • AVIF: pillow-avif-plugin gerektirir
  • HEIC: pillow-heif gerektirir

Yorumlar