Veri Kümelerine Genel Bakış
Ultralytics, nesne algılama, örnek bölümleme, anlamsal bölümleme, poz kestirimi, sınıflandırma ve çoklu nesne takibi gibi bilgisayarlı görü görevlerini kolaylaştırmak için çeşitli veri kümelerine destek sağlar. Aşağıda, ana Ultralytics veri kümelerinin bir listesi ve ardından her bir bilgisayarlı görü görevinin ve ilgili veri kümelerinin kısa bir özeti yer almaktadır.
Watch: Ultralytics Datasets Overview
Nesne Algılama
Sınırlayıcı kutu nesne algılama, her nesnenin etrafına bir sınırlayıcı kutu çizerek görüntüdeki nesneleri tespit etmeyi ve yerelleştirmeyi içeren bir bilgisayarlı görü tekniğidir.
- African-wildlife: Bufalo, fil, gergedan ve zebra dahil olmak üzere Afrika yaban hayatına ait görüntülerin yer aldığı bir veri kümesi.
- Argoverse: Kentsel ortamlardan alınan, zengin açıklamalarla desteklenmiş 3B takip ve hareket tahmin verilerini içeren bir veri kümesi.
- Brain-tumor: Beyin tümörü tespiti için MRI veya CT tarama görüntülerini, tümörün varlığı, konumu ve özellikleri hakkındaki detaylarla birlikte içeren bir veri kümesi.
- COCO: Common Objects in Context (COCO), 80 nesne kategorisine sahip geniş ölçekli bir nesne algılama, bölümleme ve altyazı oluşturma veri kümesidir.
- COCO8: COCO train ve COCO val kümelerinden ilk 4 görüntünün yer aldığı, hızlı testler için uygun daha küçük bir alt küme.
- COCO8-Grayscale: RGB görüntülerin gri tonlamaya dönüştürülmesiyle oluşturulan bir COCO8 gri tonlama sürümü; tek kanallı model değerlendirmesi için kullanışlıdır.
- COCO8-Multispectral: RGB dalga boylarının enterpolasyonuyla oluşturulan 10 kanallı bir multispektral COCO8 sürümü; spektral farkındalığı olan model değerlendirmesi için kullanışlıdır.
- COCO128: COCO train ve COCO val kümelerinden ilk 128 görüntünün yer aldığı, testler için uygun daha küçük bir alt küme.
- Construction-PPE: Baret, yelek, eldiven, bot ve koruyucu gözlük gibi temel güvenlik ekipmanlarıyla etiketlenmiş şantiye görüntülerinden oluşan; eksik ekipman etiketlerini de içeren, uyumluluk ve çalışan güvenliği için yapay zeka modellerinin geliştirilmesini destekleyen bir veri kümesi.
- Global Wheat 2020: Global Wheat Challenge 2020 için buğday başaklarının görüntülerini içeren bir veri kümesi.
- HomeObjects-3K: Akıllı ev sistemleri, robotik ve artırılmış gerçeklik alanlarında bilgisayarlı görü modelleri geliştirmek ve test etmek için ideal olan, 12 yaygın ev eşyasını içeren açıklamalı iç mekan görüntülerinden oluşan bir veri kümesi.
- KITTI Yeni: Stereo, LiDAR ve GPS/IMU girişlerini içeren, çeşitli yol sahnelerinde 2B nesne algılama için kullanılan, oldukça bilinen bir otonom sürüş veri kümesi.
- LVIS: 1203 nesne kategorisine sahip geniş ölçekli bir nesne algılama, bölümleme ve altyazı oluşturma veri kümesi.
- Medical-pills: İlaç kalite kontrolü, ayıklama ve endüstri standartlarına uyum sağlama gibi görevlere yardımcı olmak için tasarlanmış, etiketli tıbbi hap görüntülerini içeren bir veri kümesi.
- Objects365: 365 nesne kategorisi ve 600 binden fazla açıklamalı görüntü içeren, yüksek kaliteli ve geniş ölçekli bir nesne algılama veri kümesi.
- OpenImagesV7: Google tarafından sunulan, 1,7 milyon eğitim ve 42 bin doğrulama görüntüsü içeren kapsamlı bir veri kümesi.
- RF100: Kapsamlı model değerlendirmesi için yedi görüntüleme alanına yayılan 100 veri kümesi içeren çeşitli bir nesne algılama kıyaslama aracı.
- Signature: Belge doğrulama ve sahtecilik tespiti araştırmalarını destekleyen, açıklamalı imzalara sahip çeşitli belge görüntülerinden oluşan bir veri kümesi.
- SKU-110K: Perakende ortamlarında yoğun nesne algılama için 11 binden fazla görüntü ve 1,7 milyon sınırlayıcı kutu içeren bir veri kümesi.
- VisDrone: İHA ile çekilmiş görüntülerden elde edilen, 10 binden fazla görüntü ve video dizisi içeren nesne algılama ve çoklu nesne takip verisi veri kümesi.
- VOC: 20 nesne sınıfı ve 11 binden fazla görüntü ile nesne algılama ve bölümleme için kullanılan Pascal Visual Object Classes (VOC) veri kümesi.
- xView: Havadan görüntüleme üzerinde nesne algılama için 60 nesne kategorisi ve 1 milyondan fazla açıklamalı nesne içeren bir veri kümesi.
Örnek Bölümleme
Örnek bölümleme, nesnelerin bir görüntüdeki yerini piksel düzeyinde belirlemeyi ve tanımlamayı içeren bir bilgisayarlı görü tekniğidir. Her bir pikseli sadece sınıflandıran anlamsal bölümlemeden farklı olarak, örnek bölümleme aynı sınıfın farklı örnekleri arasında ayrım yapar.
- Carparts-seg: Tasarım, üretim ve araştırma ihtiyaçlarına yönelik, araç parçalarını tanımlamak için özel olarak oluşturulmuş veri kümesi. Hem nesne algılama hem de bölümleme görevleri için kullanılır.
- COCO: 200 binden fazla etiketli görüntü ile nesne algılama, bölümleme ve altyazı oluşturma görevleri için tasarlanmış geniş ölçekli bir veri kümesi.
- COCO8-seg: Örnek bölümleme görevleri için 8 adet COCO görüntüsünün bölümleme açıklamalarıyla yer aldığı daha küçük bir veri kümesi.
- COCO128-seg: Örnek bölümleme görevleri için 128 adet COCO görüntüsünün bölümleme açıklamalarıyla yer aldığı daha küçük bir veri kümesi.
- Crack-seg: Yol ve duvarlardaki çatlakları tespit etmek için özel olarak hazırlanmış; hem nesne algılama hem de bölümleme görevlerine uygulanabilir bir veri kümesi.
- Package-seg: Depolarda veya endüstriyel ortamlarda paketleri tanımlamak için hazırlanmış; hem nesne algılama hem de bölümleme uygulamaları için uygun bir veri kümesi.
Anlamsal Bölümleme
Anlamsal bölümleme, görüntüdeki her bir piksele bir sınıf etiketi atayarak otonom sürüş, sahne ayrıştırma ve arazi örtüsü haritalama gibi uygulamalar için yoğun sahne haritaları üretir.
- Cityscapes: 19 eğitim sınıfı içeren kentsel sokak sahnesi anlamsal bölümleme veri kümesi.
- Cityscapes8: Hızlı anlamsal bölümleme hattı kontrolleri için kompakt 8 görüntülük Cityscapes alt kümesi.
- ADE20K: 150 anlamsal sınıf içeren sahne ayrıştırma veri kümesi.
Poz Kestirimi
Poz kestirimi, nesnenin kameraya veya dünya koordinat sistemine göre pozunu belirlemek için kullanılan bir tekniktir. Bu, özellikle insanlar veya hayvanlar olmak üzere nesneler üzerindeki kilit noktaların veya eklemlerin tanımlanmasını içerir.
- COCO: Poz kestirimi görevleri için tasarlanmış, insan pozu açıklamalarına sahip geniş ölçekli bir veri kümesi.
- COCO8-pose: Poz kestirimi görevleri için 8 adet COCO görüntüsünün insan pozu açıklamalarıyla yer aldığı daha küçük bir veri kümesi.
- Dog-pose: Poz kestirimi görevleri için uyarlanmış, köpek başına 24 kilit nokta ile açıklanmış, köpeklere odaklanan yaklaşık 6 bin görüntülük kapsamlı bir veri kümesi.
- Hand-Keypoints: Poz kestirimi görevleri için tasarlanmış, insan ellerine odaklanan, el başına 21 kilit nokta ile açıklanmış 26 binden fazla görüntü içeren kısa bir veri kümesi.
- Tiger-pose: Poz kestirimi görevleri için kaplan başına 12 kilit nokta ile açıklanmış, kaplanlara odaklanan 263 görüntüden oluşan kompakt bir veri kümesi.
Sınıflandırma
Görüntü sınıflandırma, bir görüntüyü görsel içeriğine dayanarak önceden tanımlanmış bir veya daha fazla sınıfa veya kategoriye ayırmayı içeren bir bilgisayarlı görü görevidir.
- Caltech 101: Görüntü sınıflandırma görevleri için 101 nesne kategorisine ait görüntüleri içeren bir veri kümesi.
- Caltech 256: Caltech 101'in 256 nesne kategorisi ve daha zorlu görüntüler içeren genişletilmiş bir sürümü.
- CIFAR-10: Her sınıfta 6 bin görüntü olmak üzere 10 sınıfta 60 bin adet 32x32 boyutunda renkli görüntüden oluşan bir veri kümesi.
- CIFAR-100: CIFAR-10'un 100 nesne kategorisi ve sınıf başına 600 görüntü içeren genişletilmiş bir sürümü.
- Fashion-MNIST: Görüntü sınıflandırma görevleri için 10 moda kategorisinden 70 bin gri tonlamalı görüntü içeren bir veri kümesi.
- ImageNet: 14 milyondan fazla görüntü ve 20 bin kategori ile nesne algılama ve görüntü sınıflandırma için geniş ölçekli bir veri kümesi.
- ImageNet-10: Daha hızlı deneme ve test için 10 kategori içeren daha küçük bir ImageNet alt kümesi.
- Imagenette: Daha hızlı eğitim ve test için kolayca ayırt edilebilen 10 sınıf içeren daha küçük bir ImageNet alt kümesi.
- Imagewoof: Görüntü sınıflandırma görevleri için 10 köpek cinsi kategorisi içeren daha zorlu bir ImageNet alt kümesi.
- MNIST: Görüntü sınıflandırma görevleri için 70 bin el yazısı rakam gri tonlamalı görüntüden oluşan bir veri kümesi.
- MNIST160: MNIST veri kümesindeki her MNIST kategorisinin ilk 8 görüntüsü. Veri kümesi toplam 160 görüntü içerir.
Yönlendirilmiş Sınırlayıcı Kutular (OBB)
Yönlendirilmiş Sınırlayıcı Kutular (OBB), görüntülerdeki açılı nesneleri döndürülmüş sınırlayıcı kutular kullanarak tespit etmeye yarayan, genellikle hava ve uydu görüntülerine uygulanan bir bilgisayarlı görü yöntemidir. Geleneksel sınırlayıcı kutulardan farklı olarak, OBB çeşitli yönelimlerdeki nesnelere daha iyi uyum sağlar.
- DOTA-v2: 1,7 milyon örnek ve 11.268 görüntü ile popüler bir OBB hava görüntüleme veri kümesi.
- DOTA8: Hızlı testler için uygun, DOTAv1 bölme setinden 4'ü eğitim ve 4'ü doğrulama olmak üzere ilk 8 görüntüden oluşan daha küçük bir alt küme.
- DOTA128: OBB modellerini test etmek için boyut ve çeşitlilik arasında iyi bir denge sağlayan, eğitim ve doğrulama için 128 görüntü içeren bir DOTA alt kümesi.
Çoklu Nesne Takibi
Çoklu nesne takibi, bir video dizisinde birden fazla nesneyi zaman içinde tespit etmeyi ve izlemeyi içeren bir bilgisayarlı görü tekniğidir. Bu görev, nesnelerin kareler boyunca tutarlı kimliklerini koruyarak nesne algılamayı genişletir.
- Argoverse: Çoklu nesne takip görevleri için zengin açıklamalarla kentsel ortamlardan alınan 3B takip ve hareket tahmin verilerini içeren bir veri kümesi.
- VisDrone: İHA ile çekilmiş görüntülerden elde edilen, 10 binden fazla görüntü ve video dizisi içeren nesne algılama ve çoklu nesne takip verisi veri kümesi.
Yeni Veri Kümelerine Katkıda Bulun
Yeni bir veri kümesine katkıda bulunmak, mevcut altyapıyla uyumlu olmasını sağlamak için çeşitli adımlar içerir. Gerekli adımlar aşağıdadır:
Watch: How to Contribute to Ultralytics Datasets
Yeni Bir Veri Kümesine Katkıda Bulunma Adımları
-
Görüntüleri Topla: Veri kümesine ait görüntüleri topla. Bunlar, genel veritabanları veya kendi koleksiyonun gibi çeşitli kaynaklardan toplanabilir.
-
Görüntüleri Açıkla: Göreve bağlı olarak, bu görüntüleri sınırlayıcı kutular, bölümler veya kilit noktalarla açıkla.
-
Açıklamaları Dışa Aktar: Bu açıklamaları, Ultralytics'in desteklediği YOLO
*.txtdosya biçimine dönüştür. -
Veri Kümesini Düzenle: Veri kümeni doğru klasör yapısına göre düzenle. En üst düzey dizinlerde
images/velabels/klasörleri bulunmalı ve her birinin içindetrain/veval/alt dizinleri yer almalıdır.dataset/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/ -
data.yamlDosyası Oluştur: Veri kümenin kök dizininde, veri kümesini, sınıfları ve diğer gerekli bilgileri tanımlayan birdata.yamldosyası oluştur. -
Görüntüleri İyileştir (İsteğe bağlı): Veri kümesinin boyutunu daha verimli bir işleme için küçültmek istersen, aşağıdaki kodu kullanarak görüntüleri iyileştirebilirsin. Bu zorunlu değildir ancak daha küçük veri kümesi boyutları ve daha hızlı indirme hızları için önerilir.
-
Veri Kümesini Sıkıştır: Tüm veri kümesi klasörünü bir zip dosyası haline getir.
-
Dokümantasyon ve PR: Veri kümeni ve mevcut çerçeveye nasıl uyum sağladığını açıklayan bir dokümantasyon sayfası oluştur. Ardından bir Çekme İsteği (PR) gönder. PR gönderme hakkında daha fazla ayrıntı için Ultralytics Katkıda Bulunma Yönergeleri sayfasına başvur.
Veri Kümesini İyileştirmek ve Sıkıştırmak İçin Örnek Kod
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)Bu adımları izleyerek, Ultralytics'in mevcut yapısıyla iyi bir şekilde bütünleşen yeni bir veri kümesine katkıda bulunabilirsin.
SSS
Ultralytics nesne algılama için hangi veri kümelerini destekliyor?
Ultralytics, nesne algılama için aşağıdakiler dahil olmak üzere çok çeşitli veri kümelerini destekler:
- COCO: 80 nesne kategorisine sahip geniş ölçekli bir nesne algılama, bölümleme ve altyazı oluşturma veri kümesi.
- LVIS: Daha ince taneli nesne algılama ve bölümleme için tasarlanmış 1203 nesne kategorisine sahip kapsamlı bir veri kümesi.
- Argoverse: Kentsel ortamlardan alınan, zengin açıklamalarla desteklenmiş 3B takip ve hareket tahmin verilerini içeren bir veri kümesi.
- VisDrone: İHA ile çekilmiş görüntülerden alınan nesne algılama ve çoklu nesne takip verilerini içeren bir veri kümesi.
- SKU-110K: Perakende ortamlarında 11 binden fazla görüntüyle yoğun nesne algılama özelliği sunar.
Bu veri kümeleri, çeşitli nesne algılama uygulamaları için sağlam Ultralytics YOLO modellerinin eğitilmesini kolaylaştırır.
Ultralytics'e nasıl yeni bir veri kümesi katkısında bulunabilirim?
Yeni bir veri kümesine katkıda bulunmak birkaç adım içerir:
- Görüntüleri Topla: Genel veritabanlarından veya kişisel koleksiyonlardan görüntüleri topla.
- Görüntüleri Açıkla: Göreve bağlı olarak sınırlayıcı kutular, bölümler veya kilit noktalar uygula.
- Açıklamaları Dışa Aktar: Açıklamaları YOLO
*.txtbiçimine dönüştür. - Organize Dataset: Use the folder structure with
train/andval/directories, each containingimages/andlabels/subdirectories. data.yamlDosyası Oluştur: Veri kümesi açıklamalarını, sınıfları ve diğer ilgili bilgileri dahil et.- Görüntüleri İyileştir (İsteğe bağlı): Verimlilik için veri kümesi boyutunu küçült.
- Veri Kümesini Sıkıştır: Veri kümesini bir zip dosyası olarak sıkıştır.
- Dokümantasyon ve PR: Veri kümeni tanımla ve Ultralytics Katkıda Bulunma Yönergelerini izleyerek bir Çekme İsteği gönder.
Kapsamlı bir rehber için Yeni Veri Kümelerine Katkıda Bulun bölümünü ziyaret et.
Veri kümem için neden Ultralytics Platform'u kullanmalıyım?
Ultralytics Platform, veri kümesi yönetimi ve analizi için aşağıdakiler dahil olmak üzere güçlü özellikler sunar:
- Sorunsuz Veri Kümesi Yönetimi: Veri kümelerini tek bir yerden yükle, düzenle ve yönet.
- Anında Eğitim Entegrasyonu: Yüklenen veri kümelerini ek bir kurulum yapmadan doğrudan model eğitimi için kullan.
- Görselleştirme Araçları: Veri kümesi görsellerini ve açıklamalarını keşfet ve görselleştir.
- Veri Kümesi Analizi: Veri kümesi dağılımın ve özelliklerin hakkında içgörüler edin.
Platform, veri kümesi yönetiminden model eğitimine geçişi kolaylaştırarak tüm süreci daha verimli hale getirir. Ultralytics Platform Datasets hakkında daha fazla bilgi edin.
Bilgisayarlı görü için Ultralytics YOLO modellerinin benzersiz özellikleri nelerdir?
Ultralytics YOLO modelleri, computer vision görevleri için birçok benzersiz özellik sunar:
- Gerçek Zamanlı Performans: Zamana duyarlı uygulamalar için yüksek hızlı çıkarım ve eğitim yetenekleri.
- Çok Yönlülük: Birleşik bir çerçevede tespit, örnek segmentasyonu, anlamsal segmentasyon, sınıflandırma ve poz tahmini görevleri için destek.
- Önceden Eğitilmiş Modeller: Çeşitli uygulamalar için yüksek performanslı, önceden eğitilmiş modellere erişim sağlayarak eğitim süresini kısalt.
- Kapsamlı Topluluk Desteği: Sorun giderme ve geliştirme için aktif bir topluluk ve kapsamlı dokümantasyon.
- Kolay Entegrasyon: Mevcut projeler ve iş akışlarıyla entegrasyon için basit bir API.
YOLO modelleri hakkında daha fazlasını Ultralytics Models sayfasında keşfet.
Ultralytics araçlarını kullanarak bir veri kümesini nasıl optimize edebilir ve zipleyebilirim?
Ultralytics araçlarını kullanarak bir veri kümesini optimize etmek ve ziplemek için şu örnek kodu izle:
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)Bu işlem, daha verimli depolama ve daha hızlı indirme hızları için veri kümesi boyutunu küçültmene yardımcı olur. Bir Veri Kümesini Optimize Etme ve Zipleme hakkında daha fazla bilgi edin.