İçeriğe geç

Veri Kümelerine Genel Bakış

Ultralytics algılama, örnek segmentasyonu, poz tahmini, sınıflandırma ve çoklu nesne izleme gibi bilgisayarla görme görevlerini kolaylaştırmak için çeşitli veri kümeleri için destek sağlar. Aşağıda ana Ultralytics veri kümelerinin bir listesi ve ardından her bir bilgisayarla görme görevinin ve ilgili veri kümelerinin bir özeti yer almaktadır.



İzle: Ultralytics Veri Kümelerine Genel Bakış

YENİ 🚀 Ultralytics Explorer

Veri kümeniz için yerleştirmeler oluşturun, benzer görüntüleri arayın, SQL sorguları çalıştırın, semantik arama yapın ve hatta doğal dil kullanarak arama yapın! GUI uygulamamızla başlayabilir veya API'yi kullanarak kendi uygulamanızı oluşturabilirsiniz. Daha fazlasını buradan öğrenin.

Ultralytics Explorer Ekran Görüntüsü

Algılama Veri Kümeleri

Sınırlayıcı kutu nesne tespiti, her nesnenin etrafına bir sınırlayıcı kutu çizerek bir görüntüdeki nesneleri tespit etmeyi ve konumlandırmayı içeren bir bilgisayarla görme tekniğidir.

  • Argoverse: Zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
  • COCO: 200 binden fazla etiketli görüntü ile nesne algılama, segmentasyon ve başlıklandırma için tasarlanmış büyük ölçekli bir veri kümesi.
  • LVIS: 1203 nesne kategorisine sahip büyük ölçekli bir nesne algılama, segmentasyon ve altyazı veri kümesi.
  • COCO8: COCO train ve COCO val'den ilk 4 görüntüyü içerir, hızlı testler için uygundur.
  • Küresel Buğday 2020: Nesne algılama ve yerelleştirme görevleri için dünyanın dört bir yanından toplanan buğday başı görüntülerinden oluşan bir veri kümesi.
  • Objects365: Nesne tespiti için 365 nesne kategorisi ve 600 binden fazla açıklamalı görüntü içeren yüksek kaliteli, büyük ölçekli bir veri kümesi.
  • OpenImagesV7: Google tarafından 1,7 milyon eğitme görüntüsü ve 42 bin doğrulama görüntüsü içeren kapsamlı bir veri kümesi.
  • SKU-110K: 11K'dan fazla görüntü ve 1,7 milyon sınırlayıcı kutu ile perakende ortamlarında yoğun nesne algılama özelliğine sahip bir veri kümesi.
  • VisDrone: 10K'dan fazla görüntü ve video dizisi ile drone ile yakalanan görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.
  • VOC: Nesne algılama ve segmentasyon için 20 nesne sınıfı ve 11 binden fazla görüntü içeren Pascal Görsel Nesne Sınıfları (VOC) veri seti.
  • xView: Baş üstü görüntülerde nesne tespiti için 60 nesne kategorisi ve 1 milyondan fazla açıklamalı nesne içeren bir veri kümesi.
  • Roboflow 100: Kapsamlı model değerlendirmesi için yedi görüntü alanını kapsayan 100 veri kümesi içeren çeşitli bir nesne algılama ölçütü.
  • Beyin tümörü: Beyin tümörlerini tespit etmeye yönelik bir veri kümesi, tümör varlığı, konumu ve özellikleriyle ilgili ayrıntılar içeren MRI veya CT tarama görüntülerini içerir. Tümör tanımlamayı otomatikleştirmek, erken tanı ve tedavi planlamasına yardımcı olmak için bilgisayarla görme modellerini eğitmek için hayati önem taşır.
  • Afrika-yaban hayatı: Bufalo, fil, gergedan ve zebra gibi Afrika vahşi yaşamının görüntülerini içeren bir veri kümesi, bilgisayarla görme modellerinin eğitimine yardımcı olur. Çeşitli habitatlardaki hayvanları tanımlamak için gerekli olan bu veri seti, vahşi yaşam araştırmalarını desteklemektedir.

Örnek Segmentasyon Veri Kümeleri

Örnek segmentasyonu, bir görüntüdeki nesneleri piksel düzeyinde tanımlamayı ve konumlandırmayı içeren bir bilgisayarla görme tekniğidir.

  • COCO: 200 binden fazla etiketli görüntü ile nesne algılama, segmentasyon ve başlıklandırma görevleri için tasarlanmış büyük ölçekli bir veri kümesi.
  • COCO8-seg: Örnek segmentasyon görevleri için segmentasyon ek açıklamalarına sahip 8 COCO görüntüsünün alt kümesini içeren daha küçük bir veri kümesi.
  • Crack-seg: Yollardaki ve duvarlardaki çatlakları tespit etmek için özel olarak hazırlanmış, hem nesne algılama hem de segmentasyon görevleri için uygulanabilir veri kümesi.
  • Package-seg: Depolardaki veya endüstriyel ortamlardaki paketleri tanımlamak için uyarlanmış veri kümesi, hem nesne algılama hem de segmentasyon uygulamaları için uygundur.
  • Carparts-seg: Tasarım, üretim ve araştırma ihtiyaçlarını karşılayan araç parçalarını tanımlamak için özel olarak oluşturulmuş veri kümesi. Hem nesne algılama hem de segmentasyon görevleri için kullanılır.

Poz Tahmini

Poz tahmini, nesnenin kameraya veya dünya koordinat sistemine göre pozunu belirlemek için kullanılan bir tekniktir.

  • COCO: Poz tahmini görevleri için tasarlanmış insan pozu ek açıklamaları içeren büyük ölçekli bir veri kümesi.
  • COCO8-pose: İnsan pozu ek açıklamaları içeren 8 COCO görüntüsünün bir alt kümesini içeren, poz tahmini görevleri için daha küçük bir veri kümesi.
  • Tiger-pose: Kaplanlara odaklanan 263 görüntüden oluşan kompakt bir veri kümesi, poz tahmini görevleri için kaplan başına 12 anahtar nokta ile açıklanmıştır.

Sınıflandırma

Görüntü sınıflandırma, bir görüntüyü görsel içeriğine göre önceden tanımlanmış bir veya daha fazla sınıfa veya kategoriye ayırmayı içeren bir bilgisayarla görme görevidir.

  • Caltech 101: Görüntü sınıflandırma görevleri için 101 nesne kategorisinin görüntülerini içeren bir veri kümesi.
  • Caltech 256: Caltech 101'in 256 nesne kategorisi ve daha zorlu görüntüler içeren genişletilmiş bir versiyonu.
  • CIFAR-10: Sınıf başına 6K görüntü olmak üzere 10 sınıfta 60K 32x32 renkli görüntüden oluşan bir veri kümesi.
  • CIFAR-100: CIFAR-10'un 100 nesne kategorisi ve sınıf başına 600 görüntü içeren genişletilmiş bir versiyonu.
  • Moda-MNIST: Görüntü sınıflandırma görevleri için 10 moda kategorisine ait 70.000 gri tonlamalı görüntüden oluşan bir veri kümesi.
  • ImageNet: Nesne algılama ve görüntü sınıflandırma için 14 milyondan fazla görüntü ve 20.000 kategori içeren büyük ölçekli bir veri kümesi.
  • ImageNet-10: Daha hızlı deneme ve test için ImageNet'in 10 kategorili daha küçük bir alt kümesi.
  • Imagenette: Daha hızlı eğitim ve test için kolayca ayırt edilebilen 10 sınıf içeren daha küçük bir ImageNet alt kümesi.
  • Imagewoof: Görüntü sınıflandırma görevleri için 10 köpek cinsi kategorisi içeren ImageNet'in daha zorlu bir alt kümesi.
  • MNIST: Görüntü sınıflandırma görevleri için el yazısı rakamların 70.000 gri tonlamalı görüntüsünden oluşan bir veri kümesi.

Yönlendirilmiş Sınırlayıcı Kutular (OBB)

Yönlendirilmiş Sınırlayıcı Kutular (OBB), genellikle hava ve uydu görüntülerine uygulanan, döndürülmüş sınırlayıcı kutular kullanarak görüntülerdeki açılı nesneleri tespit etmek için bilgisayarla görmede kullanılan bir yöntemdir.

  • DOTAv2: 1,7 milyon örnek ve 11.268 görüntü içeren popüler bir OBB hava görüntüleri veri kümesi.

Çoklu Nesne Takibi

Çoklu nesne takibi, bir video dizisinde zaman içinde birden fazla nesneyi tespit etmeyi ve izlemeyi içeren bir bilgisayarla görme tekniğidir.

  • Argoverse: Çoklu nesne izleme görevleri için zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
  • VisDrone: 10K'dan fazla görüntü ve video dizisi ile drone ile yakalanan görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.

Yeni Veri Kümelerine Katkıda Bulunun

Yeni bir veri setine katkıda bulunmak, mevcut altyapıyla uyumlu olmasını sağlamak için birkaç adım içerir. Aşağıda gerekli adımlar yer almaktadır:

Yeni Bir Veri Setine Katkıda Bulunma Adımları

  1. Görüntüleri Toplayın: Veri kümesine ait görüntüleri toplayın. Bunlar kamuya açık veri tabanları veya kendi koleksiyonunuz gibi çeşitli kaynaklardan toplanabilir.

  2. Görüntülere Açıklama Ekleme: Göreve bağlı olarak bu görüntülere sınırlayıcı kutular, segmentler veya anahtar noktalarla açıklama ekleyin.

  3. Ek Açıklamaları Dışa Aktar: Bu ek açıklamaları YOLO *.txt Ultralytics 'un desteklediği dosya biçimi.

  4. Veri Kümesini Düzenle: Veri setinizi doğru klasör yapısına göre düzenleyin. Şunlara sahip olmalısınız train/ ve val/ üst düzey dizinler ve her birinin içinde bir images/ ve labels/ alt dizin.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. Oluşturmak data.yaml Dosya: Veri kümenizin kök dizininde bir data.yaml veri kümesini, sınıfları ve diğer gerekli bilgileri açıklayan dosya.

  6. Görüntüleri Optimize Edin (İsteğe Bağlı): Daha verimli işleme için veri kümesinin boyutunu küçültmek istiyorsanız, aşağıdaki kodu kullanarak görüntüleri optimize edebilirsiniz. Bu gerekli değildir, ancak daha küçük veri kümesi boyutları ve daha yüksek indirme hızları için önerilir.

  7. Veri Setini Zipleyin: Tüm veri kümesi klasörünü bir zip dosyasına sıkıştırın.

  8. Belge ve PR: Veri setinizi ve mevcut çerçeveye nasıl uyduğunu açıklayan bir dokümantasyon sayfası oluşturun. Bundan sonra, bir Çekme İsteği (PR) gönderin. PR'nin nasıl gönderileceği hakkında daha fazla bilgi için Ultralytics Katkı Yönergelerine bakın.

Bir Veri Kümesini Optimize Etmek ve Ziplemek için Örnek Kod

Bir Veri Setini Optimize Etme ve Zipleme

from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path('path/to/dataset')

# Optimize images in dataset (optional)
for f in path.rglob('*.jpg'):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Bu adımları izleyerek, Ultralytics'un mevcut yapısıyla iyi bir şekilde bütünleşen yeni bir veri kümesine katkıda bulunabilirsiniz.



Oluşturuldu 2023-11-12, Güncellendi 2024-04-02
Yazarlar: Burhan-Q (1), Laughing-q (1), RizwanMunawar (2), glenn-jocher (6), abirami-vina (1), AyushExel (2)

Yorumlar