İçeriğe geç

Veri Kümelerine Genel Bakış

Ultralytics algılama, örnek segmentasyonu, poz tahmini, sınıflandırma ve çoklu nesne izleme gibi bilgisayarla görme görevlerini kolaylaştırmak için çeşitli veri kümeleri için destek sağlar. Aşağıda ana Ultralytics veri kümelerinin bir listesi ve ardından her bir bilgisayarla görme görevinin ve ilgili veri kümelerinin bir özeti yer almaktadır.



İzle: Ultralytics Veri Kümelerine Genel Bakış

Ultralytics Kaşif

Topluluk Notu ⚠️

İtibariyle ultralytics>=8.3.10, Ultralytics explorer desteği kullanımdan kaldırılmıştır. Ama endişelenmeyin! Artık benzer ve hatta gelişmiş işlevselliğe şu yolla erişebilirsiniz Ultralytics HUBiş akışınızı kolaylaştırmak için tasarlanmış sezgisel kodsuz platformumuz. Ultralytics HUB ile tek bir satır kod yazmadan verilerinizi zahmetsizce keşfetmeye, görselleştirmeye ve yönetmeye devam edebilirsiniz. Mutlaka göz atın ve güçlü özelliklerinden yararlanın!🚀

Veri kümeniz için yerleştirmeler oluşturun, benzer görüntüleri arayın, SQL sorguları çalıştırın, semantik arama yapın ve hatta doğal dil kullanarak arama yapın! GUI uygulamamızla başlayabilir veya API'yi kullanarak kendi uygulamanızı oluşturabilirsiniz. Daha fazlasını buradan öğrenin.

Ultralytics Explorer Ekran Görüntüsü

Nesne Algılama

Sınırlayıcı kutu nesne tespiti, her nesnenin etrafına bir sınırlayıcı kutu çizerek bir görüntüdeki nesneleri tespit etmeyi ve konumlandırmayı içeren bir bilgisayarla görme tekniğidir.

  • Argoverse: Zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
  • COCO: Common Objects in Context (COCO), 80 nesne kategorisine sahip büyük ölçekli bir nesne algılama, segmentasyon ve altyazı oluşturma veri kümesidir.
  • LVIS: 1203 nesne kategorisine sahip büyük ölçekli bir nesne algılama, segmentasyon ve altyazı veri kümesi.
  • COCO8: COCO train ve COCO val'den ilk 4 görüntünün daha küçük bir alt kümesi, hızlı testler için uygundur.
  • COCO128: COCO train ve COCO val'den alınan ilk 128 görüntünün testler için uygun olan daha küçük bir alt kümesi.
  • Küresel Buğday 2020: Global Wheat Challenge 2020 için buğday başlarının görüntülerini içeren bir veri kümesi.
  • Objects365: Nesne tespiti için 365 nesne kategorisi ve 600 binden fazla açıklamalı görüntü içeren yüksek kaliteli, büyük ölçekli bir veri kümesi.
  • OpenImagesV7: Google tarafından 1,7 milyon eğitim görüntüsü ve 42 bin doğrulama görüntüsü içeren kapsamlı bir veri kümesi.
  • SKU-110K: 11K'dan fazla görüntü ve 1,7 milyon sınırlayıcı kutu ile perakende ortamlarında yoğun nesne algılama özelliğine sahip bir veri kümesi.
  • VisDrone: 10K'dan fazla görüntü ve video dizisi ile drone ile yakalanan görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.
  • VOC: Nesne algılama ve segmentasyon için 20 nesne sınıfı ve 11 binden fazla görüntü içeren Pascal Görsel Nesne Sınıfları (VOC) veri kümesi.
  • xView: Baş üstü görüntülerde nesne tespiti için 60 nesne kategorisi ve 1 milyondan fazla açıklamalı nesne içeren bir veri kümesi.
  • RF100: Kapsamlı model değerlendirmesi için yedi görüntü alanını kapsayan 100 veri kümesi içeren çeşitli bir nesne algılama ölçütü.
  • Beyin tümörü: Beyin tümörlerini tespit etmeye yönelik bir veri kümesi, tümör varlığı, konumu ve özellikleri hakkında ayrıntılar içeren MRI veya CT tarama görüntülerini içerir.
  • Afrika-yaban hayatı: Bufalo, fil, gergedan ve zebralar da dahil olmak üzere Afrika vahşi yaşamının görüntülerini içeren bir veri kümesi.
  • İmza: Belge doğrulama ve sahtekarlık tespit araştırmalarını destekleyen, açıklamalı imzalara sahip çeşitli belgelerin görüntülerini içeren bir veri kümesi.
  • Medical-pills: A dataset containing labeled images of medical-pills, designed to aid in tasks like pharmaceutical quality control, sorting, and ensuring compliance with industry standards.

Örnek Segmentasyonu

Örnek segmentasyonu, bir görüntüdeki nesneleri piksel düzeyinde tanımlamayı ve konumlandırmayı içeren bir bilgisayarla görme tekniğidir.

  • COCO: 200 binden fazla etiketli görüntü ile nesne algılama, segmentasyon ve başlıklandırma görevleri için tasarlanmış büyük ölçekli bir veri kümesi.
  • COCO8-seg: Örnek segmentasyon görevleri için segmentasyon ek açıklamalarına sahip 8 COCO görüntüsünün alt kümesini içeren daha küçük bir veri kümesi.
  • COCO128-seg: Örnek segmentasyon görevleri için, segmentasyon ek açıklamalarına sahip 128 COCO görüntüsünün bir alt kümesini içeren daha küçük bir veri kümesi.
  • Crack-seg: Yollardaki ve duvarlardaki çatlakları tespit etmek için özel olarak hazırlanmış, hem nesne algılama hem de segmentasyon görevleri için uygulanabilir veri kümesi.
  • Package-seg: Depolardaki veya endüstriyel ortamlardaki paketleri tanımlamak için uyarlanmış veri kümesi, hem nesne algılama hem de segmentasyon uygulamaları için uygundur.
  • Carparts-seg: Tasarım, üretim ve araştırma ihtiyaçlarını karşılayan araç parçalarını tanımlamak için özel olarak oluşturulmuş veri kümesi. Hem nesne algılama hem de segmentasyon görevleri için kullanılır.

Poz Tahmini

Poz tahmini, nesnenin kameraya veya dünya koordinat sistemine göre pozunu belirlemek için kullanılan bir tekniktir.

  • COCO: Poz tahmini görevleri için tasarlanmış insan pozu ek açıklamaları içeren büyük ölçekli bir veri kümesi.
  • COCO8-pose: İnsan pozu ek açıklamaları içeren 8 COCO görüntüsünün bir alt kümesini içeren, poz tahmini görevleri için daha küçük bir veri kümesi.
  • Tiger-pose: Kaplanlara odaklanan 263 görüntüden oluşan kompakt bir veri kümesi, poz tahmini görevleri için kaplan başına 12 anahtar nokta ile açıklanmıştır.
  • El-Anahtar Noktaları: Poz tahmini görevleri için tasarlanmış, el başına 21 anahtar nokta ile açıklanmış, insan eli merkezli 26.000'den fazla görüntü içeren kısa bir veri kümesi.
  • Dog-pose: Köpeklere odaklanmış yaklaşık 6.000 görüntü içeren, köpek başına 24 anahtar nokta ile açıklanmış, poz tahmini görevleri için uyarlanmış kapsamlı bir veri kümesi.

Sınıflandırma

Görüntü sınıflandırma, bir görüntüyü görsel içeriğine göre önceden tanımlanmış bir veya daha fazla sınıfa veya kategoriye ayırmayı içeren bir bilgisayarla görme görevidir.

  • Caltech 101: Görüntü sınıflandırma görevleri için 101 nesne kategorisinin görüntülerini içeren bir veri kümesi.
  • Caltech 256: Caltech 101'in 256 nesne kategorisi ve daha zorlu görüntüler içeren genişletilmiş bir versiyonu.
  • CIFAR-10: Sınıf başına 6K görüntü olmak üzere 10 sınıfta 60K 32x32 renkli görüntüden oluşan bir veri kümesi.
  • CIFAR-100: CIFAR-10'un 100 nesne kategorisi ve sınıf başına 600 görüntü içeren genişletilmiş bir versiyonu.
  • Moda-MNIST: Görüntü sınıflandırma görevleri için 10 moda kategorisine ait 70.000 gri tonlamalı görüntüden oluşan bir veri kümesi.
  • ImageNet: Nesne algılama ve görüntü sınıflandırma için 14 milyondan fazla görüntü ve 20.000 kategori içeren büyük ölçekli bir veri kümesi.
  • ImageNet-10: Daha hızlı deneme ve test için ImageNet'in 10 kategorili daha küçük bir alt kümesi.
  • Imagenette: Daha hızlı eğitim ve test için kolayca ayırt edilebilen 10 sınıf içeren daha küçük bir ImageNet alt kümesi.
  • Imagewoof: Görüntü sınıflandırma görevleri için 10 köpek cinsi kategorisi içeren ImageNet'in daha zorlu bir alt kümesi.
  • MNIST: Görüntü sınıflandırma görevleri için el yazısı rakamların 70.000 gri tonlamalı görüntüsünden oluşan bir veri kümesi.
  • MNIST160: MNIST veri kümesinden her bir MNIST kategorisinin ilk 8 görüntüsü. Veri kümesi toplam 160 görüntü içerir.

Yönlendirilmiş Sınırlayıcı Kutular (OBB)

Yönlendirilmiş Sınırlayıcı Kutular (OBB), genellikle hava ve uydu görüntülerine uygulanan, döndürülmüş sınırlayıcı kutular kullanarak görüntülerdeki açılı nesneleri tespit etmek için bilgisayarla görmede kullanılan bir yöntemdir.

  • DOTA-v2: 1,7 milyon örnek ve 11.268 görüntü içeren popüler bir OBB hava görüntüleri veri kümesi.
  • DOTA8: DOTAv1 bölünmüş setinden ilk 8 görüntünün daha küçük bir alt kümesi, eğitim için 4 ve doğrulama için 4, hızlı testler için uygundur.

Çoklu Nesne Takibi

Çoklu nesne takibi, bir video dizisinde zaman içinde birden fazla nesneyi tespit etmeyi ve izlemeyi içeren bir bilgisayarla görme tekniğidir.

  • Argoverse: Çoklu nesne izleme görevleri için zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
  • VisDrone: 10K'dan fazla görüntü ve video dizisi ile drone ile yakalanan görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.

Yeni Veri Kümelerine Katkıda Bulunun

Yeni bir veri setine katkıda bulunmak, mevcut altyapıyla uyumlu olmasını sağlamak için birkaç adım içerir. Aşağıda gerekli adımlar yer almaktadır:

Yeni Bir Veri Setine Katkıda Bulunma Adımları

  1. Görüntüleri Toplayın: Veri kümesine ait görüntüleri toplayın. Bunlar kamuya açık veri tabanları veya kendi koleksiyonunuz gibi çeşitli kaynaklardan toplanabilir.
  2. Görüntülere Açıklama Ekleme: Göreve bağlı olarak bu görüntülere sınırlayıcı kutular, segmentler veya anahtar noktalarla açıklama ekleyin.
  3. Ek Açıklamaları Dışa Aktar: Bu ek açıklamaları YOLO *.txt Ultralytics 'un desteklediği dosya biçimi.
  4. Veri Kümesini Düzenle: Veri setinizi doğru klasör yapısına göre düzenleyin. Şunlara sahip olmalısınız train/ ve val/ üst düzey dizinler ve her birinin içinde bir images/ ve labels/ alt dizin.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. Oluşturmak data.yaml Dosya: Veri kümenizin kök dizininde bir data.yaml veri kümesini, sınıfları ve diğer gerekli bilgileri açıklayan dosya.

  6. Görüntüleri Optimize Edin (İsteğe Bağlı): Daha verimli işleme için veri kümesinin boyutunu küçültmek istiyorsanız, aşağıdaki kodu kullanarak görüntüleri optimize edebilirsiniz. Bu gerekli değildir, ancak daha küçük veri kümesi boyutları ve daha yüksek indirme hızları için önerilir.
  7. Veri Setini Zipleyin: Tüm veri kümesi klasörünü bir zip dosyasına sıkıştırın.
  8. Belge ve PR: Veri setinizi ve mevcut çerçeveye nasıl uyduğunu açıklayan bir dokümantasyon sayfası oluşturun. Bundan sonra, bir Çekme İsteği (PR) gönderin. PR'nin nasıl gönderileceği hakkında daha fazla bilgi için Ultralytics Katkı Yönergelerine bakın.

Bir Veri Kümesini Optimize Etmek ve Ziplemek için Örnek Kod

Bir Veri Setini Optimize Etme ve Zipleme

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Bu adımları izleyerek, Ultralytics'un mevcut yapısıyla iyi bir şekilde bütünleşen yeni bir veri kümesine katkıda bulunabilirsiniz.

SSS

Ultralytics nesne algılama için hangi veri kümelerini destekliyor?

Ultralytics dahil olmak üzere nesne algılama için çok çeşitli veri kümelerini destekler:

  • COCO: 80 nesne kategorisine sahip büyük ölçekli bir nesne algılama, segmentasyon ve altyazı veri kümesi.
  • LVIS: Daha ince taneli nesne algılama ve segmentasyon için tasarlanmış 1203 nesne kategorisine sahip kapsamlı bir veri kümesi.
  • Argoverse: Zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
  • VisDrone: Drone ile çekilen görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.
  • SKU-110K: 11K'dan fazla görüntü ile perakende ortamlarında yoğun nesne algılama özelliğine sahiptir.

Bu veri kümeleri, çeşitli nesne algılama uygulamaları için sağlam modellerin eğitilmesini kolaylaştırır.

Ultralytics adresine nasıl yeni bir veri seti ekleyebilirim?

Yeni bir veri setine katkıda bulunmak birkaç adımdan oluşur:

  1. Görüntüleri Toplayın: Kamuya açık veri tabanlarından veya kişisel koleksiyonlardan görseller toplayın.
  2. Görüntülere Açıklama Ekleme: Göreve bağlı olarak sınırlayıcı kutular, segmentler veya anahtar noktalar uygulayın.
  3. Ek Açıklamaları Dışa Aktar: Ek açıklamaları YOLO *.txt format.
  4. Veri Kümesini Düzenle: ile klasör yapısını kullanın train/ ve val/ dizinleri, her biri images/ ve labels/ alt dizinler.
  5. Oluşturmak data.yaml Dosya: Veri kümesi açıklamalarını, sınıfları ve diğer ilgili bilgileri ekleyin.
  6. Görüntüleri Optimize Edin (İsteğe Bağlı): Verimlilik için veri kümesi boyutunu küçültün.
  7. Veri Kümesini Zipleyin: Veri kümesini bir zip dosyasına sıkıştırın.
  8. Belge ve PR: Veri setinizi açıklayın ve Ultralytics Katkı Yönergelerini izleyerek bir Çekme İsteği gönderin.

Kapsamlı bir kılavuz için Yeni Veri Kümelerine Katkıda Bulunun adresini ziyaret edin.

Veri kümem için neden Ultralytics Explorer'ı kullanmalıyım?

Ultralytics Explorer, veri kümesi analizi için aşağıdakiler de dahil olmak üzere güçlü özellikler sunar:

  • Gömme Oluşturma: Görüntüler için vektör katıştırmaları oluşturun.
  • Anlamsal Arama: Gömme veya yapay zeka kullanarak benzer görüntüleri arayın.
  • SQL Sorguları: Ayrıntılı veri analizi için gelişmiş SQL sorguları çalıştırın.
  • Doğal Dil Araması: Kullanım kolaylığı için düz dil sorguları kullanarak arama yapın.

Daha fazla bilgi almak ve GUI Demosunu denemek için Ultralytics Explorer 'ı keşfedin.

Bilgisayarla görme için Ultralytics YOLO modellerinin benzersiz özellikleri nelerdir?

Ultralytics YOLO modelleri çeşitli benzersiz özellikler sağlar:

  • Gerçek Zamanlı Performans: Yüksek hızlı çıkarım ve eğitim.
  • Çok yönlülük: Algılama, segmentasyon, sınıflandırma ve poz tahmini görevleri için uygundur.
  • Önceden Eğitilmiş Modeller: Çeşitli uygulamalar için yüksek performanslı, önceden eğitilmiş modellere erişim.
  • Kapsamlı Topluluk Desteği: Sorun giderme ve geliştirme için aktif topluluk ve kapsamlı belgeler.

YOLO hakkında daha fazlasını keşfedin Ultralytics YOLO Sayfa.

Ultralytics araçlarını kullanarak bir veri kümesini nasıl optimize edebilir ve sıkıştırabilirim?

Ultralytics araçlarını kullanarak bir veri kümesini optimize etmek ve sıkıştırmak için bu örnek kodu izleyin:

Bir Veri Setini Optimize Etme ve Zipleme

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Bir Veri Kümesini Optimize Etme ve Zipleme hakkında daha fazla bilgi edinin.

📅1 yıl önce oluşturuldu ✏️ 18 gün önce güncellendi

Yorumlar