Link to this sectionVeri Kümelerine Genel Bakış#
Ultralytics; algılama, örnek bölümleme, anlamsal bölümleme, poz tahmini, sınıflandırma ve çoklu nesne takibi gibi bilgisayarlı görü görevlerini kolaylaştırmak için çeşitli veri kümelerine destek sağlar. Aşağıda başlıca Ultralytics veri kümelerinin bir listesi, ardından her bir bilgisayarlı görü görevinin ve ilgili veri kümelerinin özeti yer almaktadır.
Watch: Ultralytics Datasets Overview
Link to this sectionNesne Algılama#
Sınırlayıcı kutu nesne algılama, her bir nesnenin etrafına bir sınırlayıcı kutu çizerek görüntüdeki nesnelerin tespit edilmesini ve konumlandırılmasını içeren bir bilgisayarlı görü tekniğidir.
- African-wildlife: Manda, fil, gergedan ve zebra dahil olmak üzere Afrika yaban hayatına ait görselleri içeren bir veri kümesi.
- Argoverse: Kentsel ortamlardan alınan, zengin açıklamalar içeren 3D takip ve hareket tahmini verilerini barındıran bir veri kümesi.
- Brain-tumor: Beyin tümörlerinin tespiti için kullanılan; tümör varlığı, konumu ve özelliklerine ilişkin ayrıntıları içeren MRI veya BT tarama görüntülerini barındıran bir veri kümesi.
- COCO: Common Objects in Context (COCO), 80 nesne kategorisine sahip büyük ölçekli bir nesne algılama, bölümleme ve altyazı oluşturma veri kümesidir.
- COCO8: Hızlı testler için uygun, COCO train ve COCO val kümelerindeki ilk 4 görselden oluşan daha küçük bir alt küme.
- COCO8-Grayscale: RGB'nin gri tonlamaya dönüştürülmesiyle oluşturulan, tek kanallı model değerlendirmesi için yararlı olan bir COCO8 gri tonlama sürümü.
- COCO8-Multispectral: RGB dalga boylarının enterpolasyonu ile oluşturulan, spektral farkındalıklı model değerlendirmesi için yararlı olan 10 kanallı bir COCO8 çok spektrumlu sürümü.
- COCO128: Testler için uygun, COCO train2017'deki ilk 128 görselden oluşan daha küçük bir alt küme.
- Construction-PPE: Kask, yelek, eldiven, bot ve gözlük gibi temel güvenlik ekipmanları ile etiketlenmiş şantiye görsellerinden oluşan; uyumluluk ve çalışan güvenliği için yapay zeka modellerinin geliştirilmesini destekleyen bir veri kümesi.
- Global Wheat 2020: Global Wheat Challenge 2020 için buğday başaklarının görsellerini içeren bir veri kümesi.
- HomeObjects-3K: Akıllı ev sistemlerinde, robotikte ve artırılmış gerçeklikte bilgisayarlı görü modellerini geliştirmek ve test etmek için ideal olan, 12 yaygın ev eşyasını içeren açıklamalı iç mekan sahneleri veri kümesi.
- KITTI Yeni: Çeşitli yol sahnelerinde 2D nesne algılama için kullanılan; stereo, LiDAR ve GPS/IMU girdilerini içeren, iyi bilinen bir otonom sürüş veri kümesi.
- LVIS: 1203 nesne kategorisine sahip büyük ölçekli bir nesne algılama, bölümleme ve altyazı oluşturma veri kümesi.
- Medical-pills: İlaç kalite kontrolü, sınıflandırma ve endüstri standartlarına uyum sağlama gibi görevlere yardımcı olmak için tasarlanmış, tıbbi hapların etiketli görsellerini içeren bir veri kümesi.
- Objects365: 365 nesne kategorisi ve 600 binden fazla açıklamalı görsel içeren, yüksek kaliteli ve büyük ölçekli bir nesne algılama veri kümesi.
- OpenImagesV7: Google tarafından sunulan, 1,7 milyon eğitim ve 42 bin doğrulama görseli içeren kapsamlı bir veri kümesi.
- RF100: Kapsamlı model değerlendirmesi için yedi görüntüleme alanına yayılan 100 veri kümesi içeren çeşitli bir nesne algılama kıyaslama aracı.
- Signature: Belge doğrulama ve sahtecilik tespiti araştırmalarını destekleyen, açıklamalı imzalara sahip çeşitli belge görsellerini içeren bir veri kümesi.
- SKU-110K: 11 binden fazla görsel ve 1,7 milyon sınırlayıcı kutu ile perakende ortamlarında yoğun nesne algılama verisi içeren bir veri kümesi.
- VisDrone: İHA tarafından çekilen 10 binden fazla görsel ve video sekansı içeren, nesne algılama ve çoklu nesne takibi verilerini barındıran bir veri kümesi.
- VOC: 20 nesne sınıfı ve 11 binden fazla görsel içeren, nesne algılama ve bölümleme için kullanılan Pascal Visual Object Classes (VOC) veri kümesi.
- xView: 60 nesne kategorisi ve 1 milyondan fazla açıklamalı nesne ile tepeden çekim görüntülerinde nesne algılama için kullanılan bir veri kümesi.
Link to this sectionÖrnek Bölümleme#
Örnek bölümleme, nesnelerin görüntüde piksel düzeyinde tanımlanmasını ve konumlandırılmasını içeren bir bilgisayarlı görü tekniğidir. Her pikseli yalnızca sınıflandıran anlamsal bölümlemenin aksine, örnek bölümleme aynı sınıfın farklı örnekleri arasında ayrım yapar.
- Carparts-seg: Tasarım, üretim ve araştırma ihtiyaçlarını karşılamak üzere araç parçalarının tanımlanması için özel olarak oluşturulmuş bir veri kümesi. Hem nesne algılama hem de bölümleme görevleri için kullanılır.
- COCO: 200 binden fazla etiketli görsel ile nesne algılama, bölümleme ve altyazı oluşturma görevleri için tasarlanmış büyük ölçekli bir veri kümesi.
- COCO8-seg: Örnek bölümleme görevleri için, bölümleme açıklamalarına sahip 8 COCO görselinden oluşan daha küçük bir alt küme.
- COCO128-seg: Örnek bölümleme görevleri için, bölümleme açıklamalarına sahip 128 COCO görselinden oluşan daha küçük bir alt küme.
- Crack-seg: Yollardaki ve duvarlardaki çatlakları tespit etmek için özel olarak hazırlanmış, hem nesne algılama hem de bölümleme görevlerine uygulanabilen bir veri kümesi.
- Package-seg: Depolardaki veya endüstriyel ortamlardaki paketlerin tanımlanması için uyarlanmış, hem nesne algılama hem de bölümleme uygulamaları için uygun bir veri kümesi.
Link to this sectionAnlamsal Bölümleme#
Anlamsal bölümleme, görüntüdeki her piksele bir sınıf etiketi atayarak; otonom sürüş, sahne ayrıştırma ve arazi örtüsü haritalama gibi uygulamalar için yoğun sahne haritaları üretir.
- Cityscapes: 19 eğitim sınıfına sahip kentsel sokak sahnesi anlamsal bölümleme veri kümesi.
- Cityscapes8: Hızlı anlamsal bölümleme hattı kontrolleri için kompakt, 8 görselden oluşan bir Cityscapes alt kümesi.
- ADE20K: 150 anlamsal sınıfa sahip sahne ayrıştırma veri kümesi.
Link to this sectionPoz Tahmini#
Poz tahmini, nesnenin kameraya veya dünya koordinat sistemine göre pozunu belirlemek için kullanılan bir tekniktir. Bu, nesneler (özellikle insanlar veya hayvanlar) üzerindeki anahtar noktaların veya eklemlerin tanımlanmasını içerir.
- COCO: Poz tahmini görevleri için tasarlanmış, insan pozu açıklamalarına sahip büyük ölçekli bir veri kümesi.
- COCO8-pose: Poz tahmini görevleri için, insan pozu açıklamalarına sahip 8 COCO görselinden oluşan daha küçük bir alt küme.
- Dog-pose: Köpeklere odaklanan yaklaşık 8.500 görsel içeren, her köpek için 24 anahtar nokta ile açıklanmış ve poz tahmini görevlerine göre uyarlanmış kapsamlı bir veri kümesi.
- Hand-Keypoints: İnsan ellerine odaklanan 26 binden fazla görsel içeren, el başına 21 anahtar nokta ile açıklanmış ve poz tahmini görevleri için tasarlanmış kısa bir veri kümesi.
- Tiger-pose: Kaplanlara odaklanan 263 görselden oluşan, kaplan başına 12 anahtar nokta ile poz tahmini görevleri için açıklanmış kompakt bir veri kümesi.
Link to this sectionSınıflandırma#
Görüntü sınıflandırma, görsel içeriğine dayalı olarak bir görüntüyü önceden tanımlanmış bir veya daha fazla sınıfa ya da kategoriye ayırmayı içeren bir bilgisayarlı görü görevidir.
- Caltech 101: Görüntü sınıflandırma görevleri için 101 nesne kategorisine ait görselleri içeren bir veri kümesi.
- Caltech 256: Caltech 101'in 256 nesne kategorisine ve daha zorlu görüntülere sahip genişletilmiş bir sürümü.
- CIFAR-10: 10 sınıfta 60 bin adet 32x32 renkli görsel içeren, sınıf başına 6 bin görsel barındıran bir veri kümesi.
- CIFAR-100: CIFAR-10'un 100 nesne kategorisine ve sınıf başına 600 görsel içeren genişletilmiş bir sürümü.
- Fashion-MNIST: Görüntü sınıflandırma görevleri için 10 moda kategorisine ait 70 bin gri tonlamalı görselden oluşan bir veri kümesi.
- ImageNet: 14 milyondan fazla görsel ve 20 bin kategoriye sahip, büyük ölçekli bir nesne algılama ve görüntü sınıflandırma veri kümesi.
- ImageNet-10: Daha hızlı deneme ve test için 10 kategoriye sahip daha küçük bir ImageNet alt kümesi.
- Imagenette: Daha hızlı eğitim ve test için kolayca ayırt edilebilen 10 sınıf içeren, daha küçük bir ImageNet alt kümesi.
- Imagewoof: Görüntü sınıflandırma görevleri için 10 köpek ırkı kategorisi içeren daha zorlu bir ImageNet alt kümesi.
- MNIST: Görüntü sınıflandırma görevleri için el yazısı rakamların bulunduğu 70 bin gri tonlamalı görsel içeren bir veri kümesi.
- MNIST160: MNIST eğitim ve test bölümlerinin her birinden her rakamın (0-9) ilk 8 görseli. Veri kümesi toplam 160 görsel içerir.
Link to this sectionYönlendirilmiş Sınırlayıcı Kutular (OBB)#
Yönlendirilmiş Sınırlayıcı Kutular (OBB), bilgisayarlı göride genellikle hava ve uydu görüntülerine uygulanan; döndürülmüş sınırlayıcı kutular kullanarak görüntülerdeki açılı nesnelerin tespit edilmesi yöntemidir. Geleneksel sınırlayıcı kutuların aksine OBB, nesnelere farklı yönelimlerde daha iyi uyum sağlayabilir.
- DOTA-v2: 1,7 milyon örnek ve 11.268 görsel içeren popüler bir OBB hava görüntüleme veri kümesi.
- DOTA8: DOTAv1 bölünmüş setinden ilk 8 görselden (4 eğitim, 4 doğrulama için) oluşan, hızlı testler için uygun daha küçük bir alt küme.
- DOTA128: Eğitim ve doğrulama için 128 görsel içeren, OBB modellerini test etmek için boyut ve çeşitlilik arasında iyi bir denge sağlayan 128 görselden oluşan bir DOTA alt kümesi.
Link to this sectionÇoklu Nesne Takibi#
Çoklu nesne takibi, bir video sekansındaki birden fazla nesnenin zaman içinde tespit edilmesini ve takip edilmesini içeren bir bilgisayarlı görü tekniğidir. Bu görev, kareler boyunca nesnelerin tutarlı kimliklerini koruyarak nesne algılamayı genişletir.
- Argoverse: Çoklu nesne takibi görevleri için zengin açıklamalar içeren; kentsel ortamlardan alınan 3D takip ve hareket tahmini verilerini barındıran bir veri kümesi.
- VisDrone: İHA tarafından çekilen 10 binden fazla görsel ve video sekansı içeren, nesne algılama ve çoklu nesne takibi verilerini barındıran bir veri kümesi.
Link to this sectionYeni Veri Kümelerine Katkıda Bulunma#
Yeni bir veri kümesine katkıda bulunmak, mevcut altyapıyla uyumlu olduğundan emin olmak için çeşitli adımlar içerir. Gerekli adımlar şunlardır:
Watch: How to Contribute to Ultralytics Datasets
Link to this sectionYeni Bir Veri Kümesine Katkıda Bulunma Adımları#
-
Görselleri Topla: Veri kümesine ait görselleri topla. Bunlar, genel veritabanları veya kendi koleksiyonun gibi çeşitli kaynaklardan toplanabilir.
-
Görselleri Açıkla: Göreve bağlı olarak, bu görselleri sınırlayıcı kutular, bölümler veya anahtar noktalar ile açıkla.
-
Açıklamaları Dışa Aktar: Bu açıklamaları, Ultralytics tarafından desteklenen YOLO
*.txtdosya formatına dönüştür. -
Veri Kümesini Düzenle: Veri kümeni doğru klasör yapısına göre düzenle.
images/velabels/şeklinde üst düzey dizinlerin olmalı ve her birinin içinde birtrain/veval/alt dizini bulunmalıdır.dataset/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/ -
Bir
data.yamlDosyası Oluştur: Veri kümenin kök dizininde, veri kümesini, sınıfları ve diğer gerekli bilgileri tanımlayan birdata.yamldosyası oluştur. -
Görselleri Optimize Et (İsteğe bağlı): Daha verimli işleme için veri kümesinin boyutunu küçültmek istersen, aşağıdaki kodu kullanarak görselleri optimize edebilirsin. Bu zorunlu değildir ancak daha küçük veri kümesi boyutları ve daha hızlı indirme hızları için önerilir.
-
Veri Kümesini Sıkıştır: Tüm veri kümesi klasörünü bir zip dosyası haline getir.
-
Belgele ve PR Gönder: Veri kümeni ve mevcut çerçeveye nasıl uyum sağladığını açıklayan bir dokümantasyon sayfası oluştur. Ardından bir Pull Request (PR) gönder. PR'ın nasıl gönderileceğiyle ilgili daha fazla ayrıntı için Ultralytics Katkıda Bulunma Kılavuzu sayfasına bak.
Link to this sectionVeri Kümesini Optimize Etmek ve Sıkıştırmak İçin Örnek Kod#
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)Bu adımları izleyerek, Ultralytics'in mevcut yapısıyla iyi bir şekilde bütünleşen yeni bir veri kümesine katkıda bulunabilirsin.
Link to this sectionSSS#
Link to this sectionUltralytics, nesne algılama için hangi veri kümelerini destekler?#
Ultralytics, nesne algılama için aşağıdakiler dahil çok çeşitli veri kümelerini destekler:
- COCO: 80 nesne kategorisine sahip büyük ölçekli bir nesne algılama, bölümleme ve altyazı oluşturma veri kümesi.
- LVIS: Daha hassas nesne algılama ve bölümleme için tasarlanmış, 1203 nesne kategorisine sahip kapsamlı bir veri kümesi.
- Argoverse: Kentsel ortamlardan alınan, zengin açıklamalar içeren 3D takip ve hareket tahmini verilerini barındıran bir veri kümesi.
- VisDrone: İHA tarafından çekilen görüntülerden elde edilen nesne algılama ve çoklu nesne takibi verilerini barındıran bir veri kümesi.
- SKU-110K: 11 binden fazla görsel ile perakende ortamlarında yoğun nesne algılama verisi içerir.
Bu veri kümeleri, çeşitli nesne algılama uygulamaları için sağlam Ultralytics YOLO modellerinin eğitilmesini kolaylaştırır.
Link to this sectionUltralytics'e nasıl yeni bir veri kümesi katkısında bulunabilirim?#
Yeni bir veri kümesine katkıda bulunmak çeşitli adımlar içerir:
- Görselleri Topla: Genel veritabanlarından veya kişisel koleksiyonlardan görselleri topla.
- Görselleri Açıkla: Göreve bağlı olarak sınırlayıcı kutular, bölümler veya anahtar noktalar uygula.
- Açıklamaları Dışa Aktar: Açıklamaları YOLO
*.txtformatına dönüştür. - Organize Dataset: Use the folder structure with
train/andval/directories, each containingimages/andlabels/subdirectories. - Bir
data.yamlDosyası Oluştur: Veri kümesi açıklamalarını, sınıfları ve diğer ilgili bilgileri dahil et. - Görselleri Optimize Et (İsteğe bağlı): Verimlilik için veri kümesi boyutunu küçült.
- Veri Kümesini Sıkıştır: Veri kümesini bir zip dosyası halinde sıkıştır.
- Belgele ve PR Gönder: Veri kümeni açıkla ve Ultralytics Katkıda Bulunma Kılavuzunu izleyerek bir Pull Request gönder.
Kapsamlı bir kılavuz için Yeni Veri Kümelerine Katkıda Bulunma bölümünü ziyaret et.
Link to this sectionVeri kümem için neden Ultralytics Platformu'nu kullanmalıyım?#
Ultralytics Platform, veri kümesi yönetimi ve analizi için aşağıdakiler dahil olmak üzere güçlü özellikler sunar:
- Sorunsuz Veri Kümesi Yönetimi: Veri kümelerini tek bir yerden yükle, düzenle ve yönet.
- Anında Eğitim Entegrasyonu: Yüklenen veri kümelerini ek bir kuruluma gerek kalmadan doğrudan model eğitimi için kullan.
- Görselleştirme Araçları: Veri kümesi görsellerini ve ek açıklamalarını keşfet ve görselleştir.
- Veri Kümesi Analizi: Veri kümesi dağılımın ve özelliklerin hakkında bilgiler edin.
Platform, veri kümesi yönetiminden model eğitimine geçişi kolaylaştırarak tüm süreci daha verimli hale getirir. Ultralytics Platform Datasets hakkında daha fazla bilgi edin.
Link to this sectionBilgisayarlı görü için Ultralytics YOLO modellerinin benzersiz özellikleri nelerdir?#
Ultralytics YOLO modelleri, computer vision görevleri için birkaç benzersiz özellik sağlar:
- Gerçek Zamanlı Performans: Zamana duyarlı uygulamalar için yüksek hızlı çıkarım ve eğitim yetenekleri.
- Çok Yönlülük: Birleşik bir çerçevede nesne tespiti, örnek bölümleme, anlamsal bölümleme, sınıflandırma ve poz tahmini görevleri için destek.
- Önceden Eğitilmiş Modeller: Çeşitli uygulamalar için yüksek performanslı, önceden eğitilmiş modellere erişim sağlayarak eğitim süresini kısalt.
- Kapsamlı Topluluk Desteği: Sorun giderme ve geliştirme için aktif bir topluluk ve kapsamlı dokümantasyon.
- Kolay Entegrasyon: Mevcut projeler ve iş akışlarıyla entegrasyon için basit bir API.
YOLO modelleri hakkında daha fazlasını Ultralytics Models sayfasında keşfet.
Link to this sectionUltralytics araçlarını kullanarak bir veri kümesini nasıl optimize edebilir ve zipleyebilirim?#
Ultralytics araçlarını kullanarak bir veri kümesini optimize etmek ve ziplemek için şu örnek kodu izle:
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)Bu işlem, daha verimli depolama ve daha hızlı indirme hızları için veri kümesi boyutunu küçültmeye yardımcı olur. Optimize and Zip a Dataset hakkında daha fazla bilgi edin.