İçeriğe geç

COCO12-Formatları Veri Kümesi

Giriş

Bir Ultralytics COCO12-Formatları veri kümesi, desteklenen 12 görüntü formatı uzantısının tamamında görüntü yüklemesini doğrulamak için tasarlanmış özel bir test veri kümesidir. Görüntü yükleme işlem hattının kapsamlı bir şekilde test edilmesini sağlamak için her biri farklı bir formatta kaydedilmiş 12 görüntü (6 eğitim, 6 doğrulama için) içerir.

Bu veri kümesi şunlar için paha biçilmezdir:

  • Görüntü formatı desteğini test etme: Desteklenen tüm formatların doğru yüklendiğini doğrulayın
  • CI/CD işlem hatları: Format uyumluluğunun otomatik testi
  • Hata ayıklama: Eğitim işlem hatlarındaki formata özgü sorunları izole etme
  • Geliştirme: Yeni format eklemelerini veya değişikliklerini doğrulama

Desteklenen Formatlar

Veri kümesi, tanımlanan 12 desteklenen format uzantısının her biri için bir görüntü içerir ultralytics/data/utils.py:

FormatUzantıAçıklamaEğitim/Doğrulama
AVIF.avifAV1 Görüntü Dosyası Formatı (modern)Eğit
BMP.bmpBitmap - sıkıştırılmamış raster formatıEğit
DNG.dngDijital Negatif - Adobe RAW formatıEğit
HEIC.heicYüksek Verimli Görüntü KodlamaEğit
JPEG.jpegTam uzantılı JPEGEğit
JPG.jpgKısa uzantılı JPEGEğit
JP2.jp2JPEG 2000 - tıbbi/coğrafiDoğrula
MPO.mpoÇoklu Resim Nesnesi (stereo görüntüler)Doğrula
PNG.pngTaşınabilir Ağ GrafikleriDoğrula
TIF.tifKısa uzantılı TIFFDoğrula
TIFF.tiffEtiketli Görüntü Dosya FormatıDoğrula
WebP.webpModern web görüntü formatıDoğrula

Veri Seti Yapısı

coco12-formats/
├── images/
│   ├── train/          # 6 images (avif, bmp, dng, heic, jpeg, jpg)
│   └── val/            # 6 images (jp2, mpo, png, tif, tiff, webp)
├── labels/
│   ├── train/          # Corresponding YOLO format labels
│   └── val/
└── coco12-formats.yaml # Dataset configuration

Veri Seti YAML

COCO12-Formats veri kümesi, veri kümesi yollarını ve sınıf adlarını tanımlayan bir yaml dosyası kullanılarak yapılandırılır. Resmi olanı inceleyebilirsiniz coco12-formats.yaml dosyası içinde Ultralytics GitHub deposunu.

ultralytics/cfg/datasets/coco12-formats.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO12-Formats dataset (12 images testing all supported image formats) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco12-formats/
# Example usage: yolo train data=coco12-formats.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco12-formats ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco12-formats # dataset root dir
train: images/train # train images (relative to 'path') 6 images
val: images/val # val images (relative to 'path') 6 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco12-formats.zip

Gereksinimler

Bazı formatlar ek bağımlılıklar gerektirir:

pip install pillow pillow-heif pillow-avif-plugin

AVIF Sistem Kütüphanesi (İsteğe Bağlı)

OpenCV'nin AVIF dosyalarını doğrudan okuyabilmesi için, libavif yüklü olması gerekir önce OpenCV'yi derlerken:

brew install libavif
sudo apt install libavif-dev libavif-bin
git clone -b v1.2.1 https://github.com/AOMediaCodec/libavif.git
cd libavif
cmake -B build -DAVIF_CODEC_AOM=SYSTEM -DAVIF_BUILD_APPS=ON
cmake --build build --config Release --parallel
sudo cmake --install build

Not

pip ile yüklenen opencv-python paket, önceden derlenmiş olduğu için AVIF desteği içermeyebilir. Ultralytics, Pillow'u şununla kullanır pillow-avif-plugin OpenCV desteği olmadığında AVIF görüntüler için bir yedek olarak.

Kullanım

COCO12-Formats veri kümesinde bir YOLO modeli eğitmek için aşağıdaki örnekleri kullanın:

Eğitim Örneği

from ultralytics import YOLO

# Load a pretrained YOLO model
model = YOLO("yolo26n.pt")

# Train on COCO12-Formats to test all image formats
results = model.train(data="coco12-formats.yaml", epochs=1, imgsz=640)
# Train YOLO on COCO12-Formats
yolo detect train data=coco12-formats.yaml model=yolo26n.pt epochs=1 imgsz=640

Formata Özel Notlar

AVIF (AV1 Görüntü Dosyası Formatı)

AVIF, AV1 video kodekine dayalı modern bir görüntü formatıdır ve mükemmel sıkıştırma sunar. Şunu gerektirir: pillow-avif-plugin:

pip install pillow-avif-plugin

DNG (Dijital Negatif)

DNG, Adobe'nin TIFF tabanlı açık RAW formatıdır. Test amaçlı olarak, veri kümesi şu uzantıya sahip TIFF tabanlı dosyaları kullanır: .dng uzantısı.

JP2 (JPEG 2000)

JPEG 2000, geleneksel JPEG'den daha iyi sıkıştırma ve kalite sunan dalgacık tabanlı bir görüntü sıkıştırma standardıdır. Tıbbi görüntüleme (DICOM), coğrafi uzamsal uygulamalar ve dijital sinema alanlarında yaygın olarak kullanılır. Hem OpenCV hem de Pillow tarafından yerel olarak desteklenir.

MPO (Çoklu Resim Nesnesi)

MPO dosyaları stereoskopik (3D) görüntüler için kullanılır. Veri kümesi, format testi için standart JPEG verilerini şu uzantıyla depolar: .mpo uzantısı.

HEIC (Yüksek Verimli Görüntü Kodlama)

HEIC şunları gerektirir: pillow-heif paketi doğru kodlama için:

pip install pillow-heif

Kullanım Alanları

CI/CD Testi

from ultralytics import YOLO


def test_all_image_formats():
    """Test that all image formats load correctly."""
    model = YOLO("yolo26n.pt")
    results = model.train(data="coco12-formats.yaml", epochs=1, imgsz=64)
    assert results is not None

Format Doğrulama

from pathlib import Path

from ultralytics.data.utils import IMG_FORMATS

# Verify all formats are represented
dataset_dir = Path("datasets/coco12-formats/images")
found_formats = {f.suffix[1:].lower() for f in dataset_dir.rglob("*.*")}
assert found_formats == IMG_FORMATS, f"Missing formats: {IMG_FORMATS - found_formats}"

Alıntılar ve Teşekkürler

Araştırmanızda COCO veri kümesini kullanıyorsanız, lütfen şu şekilde atıfta bulunun:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Doll{\'a}r},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

SSS

COCO12-Formatları Veri Kümesi Ne İçin Kullanılır?

COCO12-Formatları veri kümesi, Ultralytics YOLO eğitim işlem hatlarında görüntü formatı uyumluluğunu test etmek için tasarlanmıştır. Bu, desteklenen 12 görüntü formatının (AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WebP) tamamının doğru şekilde yüklendiğini ve işlendiğini garanti eder.

Neden Birden Fazla Görüntü Formatı Test Edilmeli?

Farklı görüntü formatları benzersiz özelliklere (sıkıştırma, bit derinliği, renk uzayları) sahiptir. Tüm formatları test etmek şunları sağlar:

  • Sağlam görüntü yükleme kodu
  • Çeşitli veri kümeleri arasında uyumluluk
  • Formata özgü hataların erken tespiti

Hangi Formatlar Özel Bağımlılıklar Gerektirir?

  • AVIF: Gerektirir pillow-avif-plugin
  • HEIC: Gerektirir pillow-heif


📅 1 ay önce oluşturuldu ✏️ 12 gün önce güncellendi
onuralpszrglenn-jocher

Yorumlar