Veri Kümelerine Genel Bakış

Q: How do I contribute a new dataset to Ultralytics?

Yeni bir veri kümesine katkıda bulunmak birkaç adım içerir: Kapsamlı bir kılavuz için Yeni Veri Kümelerine Katkıda Bulunun sayfasını ziyaret edin.

Ultralytics algılama, örnek segmentasyonu, poz tahmini, sınıflandırma ve çoklu nesne izleme gibi bilgisayarla görme görevlerini kolaylaştırmak için çeşitli veri kümeleri için destek sağlar. Aşağıda ana Ultralytics veri kümelerinin bir listesi ve ardından her bir bilgisayarla görme görevinin ve ilgili veri kümelerinin bir özeti yer almaktadır.

İzle: Ultralytics Veri Kümelerine Genel Bakış

Nesne Algılama

Sınırlayıcı kutu nesne tespiti, her nesnenin etrafına bir sınırlayıcı kutu çizerek bir görüntüdeki nesneleri tespit etmeyi ve konumlandırmayı içeren bir bilgisayarla görme tekniğidir.

Argoverse: Zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
COCO: Common Objects in Context (COCO), 80 nesne kategorisine sahip büyük ölçekli bir nesne algılama, segmentasyon ve altyazı oluşturma veri kümesidir.
LVIS: 1203 nesne kategorisine sahip büyük ölçekli bir nesne algılama, segmentasyon ve altyazı veri kümesi.
COCO8: COCO train ve COCO val'den ilk 4 görüntünün daha küçük bir alt kümesi, hızlı testler için uygundur.
COCO128: COCO train ve COCO val'den alınan ilk 128 görüntünün testler için uygun olan daha küçük bir alt kümesi.
Küresel Buğday 2020: Global Wheat Challenge 2020 için buğday başlarının görüntülerini içeren bir veri kümesi.
Objects365: Nesne tespiti için 365 nesne kategorisi ve 600 binden fazla açıklamalı görüntü içeren yüksek kaliteli, büyük ölçekli bir veri kümesi.
OpenImagesV7: Google tarafından 1,7 milyon eğitim görüntüsü ve 42 bin doğrulama görüntüsü içeren kapsamlı bir veri kümesi.
SKU-110K: 11K'dan fazla görüntü ve 1,7 milyon sınırlayıcı kutu ile perakende ortamlarında yoğun nesne algılama özelliğine sahip bir veri kümesi.
VisDrone: 10K'dan fazla görüntü ve video dizisi ile drone ile yakalanan görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.
VOC: Nesne algılama ve segmentasyon için 20 nesne sınıfı ve 11 binden fazla görüntü içeren Pascal Görsel Nesne Sınıfları (VOC) veri kümesi.
xView: Baş üstü görüntülerde nesne tespiti için 60 nesne kategorisi ve 1 milyondan fazla açıklamalı nesne içeren bir veri kümesi.
RF100: Kapsamlı model değerlendirmesi için yedi görüntü alanını kapsayan 100 veri kümesi içeren çeşitli bir nesne algılama ölçütü.
Beyin tümörü: Beyin tümörlerini tespit etmeye yönelik bir veri kümesi, tümör varlığı, konumu ve özellikleri hakkında ayrıntılar içeren MRI veya CT tarama görüntülerini içerir.
Afrika-yaban hayatı: Bufalo, fil, gergedan ve zebralar da dahil olmak üzere Afrika vahşi yaşamının görüntülerini içeren bir veri kümesi.
İmza: Belge doğrulama ve sahtekarlık tespit araştırmalarını destekleyen, açıklamalı imzalara sahip çeşitli belgelerin görüntülerini içeren bir veri kümesi.
Tıbbi haplar: Farmasötik kalite kontrolü, sıralama ve endüstri standartlarına uygunluğun sağlanması gibi görevlere yardımcı olmak için tasarlanmış, tıbbi hapların etiketlenmiş görüntülerini içeren bir veri kümesi.

Örnek Segmentasyonu

Örnek segmentasyonu, bir görüntüdeki nesneleri piksel düzeyinde tanımlamayı ve konumlandırmayı içeren bir bilgisayarla görme tekniğidir. Sadece her bir pikseli sınıflandıran semantik segmentasyonun aksine, örnek segmentasyonu aynı sınıfın farklı örnekleri arasında ayrım yapar.

COCO: 200 binden fazla etiketli görüntü ile nesne algılama, segmentasyon ve başlıklandırma görevleri için tasarlanmış büyük ölçekli bir veri kümesi.
COCO8-seg: Örnek segmentasyon görevleri için segmentasyon ek açıklamalarına sahip 8 COCO görüntüsünün alt kümesini içeren daha küçük bir veri kümesi.
COCO128-seg: Örnek segmentasyon görevleri için, segmentasyon ek açıklamalarına sahip 128 COCO görüntüsünün bir alt kümesini içeren daha küçük bir veri kümesi.
Crack-seg: Yollardaki ve duvarlardaki çatlakları tespit etmek için özel olarak hazırlanmış, hem nesne algılama hem de segmentasyon görevleri için uygulanabilir veri kümesi.
Package-seg: Depolardaki veya endüstriyel ortamlardaki paketleri tanımlamak için uyarlanmış veri kümesi, hem nesne algılama hem de segmentasyon uygulamaları için uygundur.
Carparts-seg: Tasarım, üretim ve araştırma ihtiyaçlarını karşılayan araç parçalarını tanımlamak için özel olarak oluşturulmuş veri kümesi. Hem nesne algılama hem de segmentasyon görevleri için kullanılır.

Poz Tahmini

Poz tahmini, nesnenin kameraya veya dünya koordinat sistemine göre pozunu belirlemek için kullanılan bir tekniktir. Bu, özellikle insanlar veya hayvanlar olmak üzere nesneler üzerindeki kilit noktaların veya eklemlerin belirlenmesini içerir.

COCO: Poz tahmini görevleri için tasarlanmış insan pozu ek açıklamaları içeren büyük ölçekli bir veri kümesi.
COCO8-pose: İnsan pozu ek açıklamaları içeren 8 COCO görüntüsünün bir alt kümesini içeren, poz tahmini görevleri için daha küçük bir veri kümesi.
Tiger-pose: Kaplanlara odaklanan 263 görüntüden oluşan kompakt bir veri kümesi, poz tahmini görevleri için kaplan başına 12 anahtar nokta ile açıklanmıştır.
El-Anahtar Noktaları: Poz tahmini görevleri için tasarlanmış, el başına 21 anahtar nokta ile açıklanmış, insan eli merkezli 26.000'den fazla görüntü içeren kısa bir veri kümesi.
Dog-pose: Köpeklere odaklanmış yaklaşık 6.000 görüntü içeren, köpek başına 24 anahtar nokta ile açıklanmış, poz tahmini görevleri için uyarlanmış kapsamlı bir veri kümesi.

Sınıflandırma

Görüntü sınıflandırma, bir görüntüyü görsel içeriğine göre önceden tanımlanmış bir veya daha fazla sınıfa veya kategoriye ayırmayı içeren bir bilgisayarla görme görevidir.

Caltech 101: Görüntü sınıflandırma görevleri için 101 nesne kategorisinin görüntülerini içeren bir veri kümesi.
Caltech 256: Caltech 101'in 256 nesne kategorisi ve daha zorlu görüntüler içeren genişletilmiş bir versiyonu.
CIFAR-10: Sınıf başına 6K görüntü olmak üzere 10 sınıfta 60K 32x32 renkli görüntüden oluşan bir veri kümesi.
CIFAR-100: CIFAR-10'un 100 nesne kategorisi ve sınıf başına 600 görüntü içeren genişletilmiş bir versiyonu.
Moda-MNIST: Görüntü sınıflandırma görevleri için 10 moda kategorisine ait 70.000 gri tonlamalı görüntüden oluşan bir veri kümesi.
ImageNet: Nesne algılama ve görüntü sınıflandırma için 14 milyondan fazla görüntü ve 20.000 kategori içeren büyük ölçekli bir veri kümesi.
ImageNet-10: Daha hızlı deneme ve test için ImageNet'in 10 kategorili daha küçük bir alt kümesi.
Imagenette: Daha hızlı eğitim ve test için kolayca ayırt edilebilen 10 sınıf içeren daha küçük bir ImageNet alt kümesi.
Imagewoof: Görüntü sınıflandırma görevleri için 10 köpek cinsi kategorisi içeren ImageNet'in daha zorlu bir alt kümesi.
MNIST: Görüntü sınıflandırma görevleri için el yazısı rakamların 70.000 gri tonlamalı görüntüsünden oluşan bir veri kümesi.
MNIST160: MNIST veri kümesinden her bir MNIST kategorisinin ilk 8 görüntüsü. Veri kümesi toplam 160 görüntü içerir.

Yönlendirilmiş Sınırlayıcı Kutular (OBB)

Yönlendirilmiş Sınırlayıcı Kutular (OBB), genellikle hava ve uydu görüntülerine uygulanan, döndürülmüş sınırlayıcı kutular kullanarak görüntülerdeki açılı nesneleri tespit etmek için bilgisayarla görmede kullanılan bir yöntemdir. Geleneksel sınırlayıcı kutuların aksine, OBB çeşitli yönlerdeki nesnelere daha iyi uyum sağlayabilir.

DOTA-v2: 1,7 milyon örnek ve 11.268 görüntü içeren popüler bir OBB hava görüntüleri veri kümesi.
DOTA8: DOTAv1 bölünmüş setinden ilk 8 görüntünün daha küçük bir alt kümesi, eğitim için 4 ve doğrulama için 4, hızlı testler için uygundur.

Çoklu Nesne Takibi

Çoklu nesne takibi, bir video dizisinde zaman içinde birden fazla nesneyi tespit etmeyi ve izlemeyi içeren bir bilgisayarla görme tekniğidir. Bu görev, çerçeveler arasında nesnelerin tutarlı kimliklerini koruyarak nesne algılamayı genişletir.

Argoverse: Çoklu nesne izleme görevleri için zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
VisDrone: 10K'dan fazla görüntü ve video dizisi ile drone ile yakalanan görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.

Yeni Veri Kümelerine Katkıda Bulunun

Yeni bir veri setine katkıda bulunmak, mevcut altyapıyla uyumlu olmasını sağlamak için birkaç adım içerir. Aşağıda gerekli adımlar yer almaktadır:

İzle: Ultralytics Veri Kümelerine Nasıl Katkıda Bulunulur 🚀

Yeni Bir Veri Setine Katkıda Bulunma Adımları

Görüntüleri Toplayın: Veri kümesine ait görüntüleri toplayın. Bunlar kamuya açık veri tabanları veya kendi koleksiyonunuz gibi çeşitli kaynaklardan toplanabilir.
Görüntülere Açıklama Ekleme: Göreve bağlı olarak bu görüntülere sınırlayıcı kutular, segmentler veya anahtar noktalarla açıklama ekleyin.
Ek Açıklamaları Dışa Aktar: Bu ek açıklamaları YOLO *.txt Ultralytics 'un desteklediği dosya biçimi.
Veri Kümesini Düzenle: Veri setinizi doğru klasör yapısına göre düzenleyin. Şunlara sahip olmalısınız train/ ve val/ üst düzey dizinler ve her birinin içinde bir images/ ve labels/ alt dizin.
```
dataset/
├── train/
│   ├── images/
│   └── labels/
└── val/
    ├── images/
    └── labels/
```
Oluşturmak data.yaml Dosya: Veri kümenizin kök dizininde bir data.yaml veri kümesini, sınıfları ve diğer gerekli bilgileri açıklayan dosya.
Görüntüleri Optimize Edin (İsteğe Bağlı): Daha verimli işleme için veri kümesinin boyutunu küçültmek istiyorsanız, aşağıdaki kodu kullanarak görüntüleri optimize edebilirsiniz. Bu gerekli değildir, ancak daha küçük veri kümesi boyutları ve daha yüksek indirme hızları için önerilir.
Veri Setini Zipleyin: Tüm veri kümesi klasörünü bir zip dosyasına sıkıştırın.
Belge ve PR: Veri setinizi ve mevcut çerçeveye nasıl uyduğunu açıklayan bir dokümantasyon sayfası oluşturun. Bundan sonra, bir Çekme İsteği (PR) gönderin. PR'nin nasıl gönderileceği hakkında daha fazla bilgi için Ultralytics Katkı Yönergelerine bakın.

Bir Veri Kümesini Optimize Etmek ve Ziplemek için Örnek Kod

Bir Veri Setini Optimize Etme ve Zipleme

Python

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Bu adımları izleyerek, Ultralytics'un mevcut yapısıyla iyi bir şekilde bütünleşen yeni bir veri kümesine katkıda bulunabilirsiniz.

SSS

Ultralytics nesne algılama için hangi veri kümelerini destekliyor?

Ultralytics , nesne algılama için aşağıdakiler de dahil olmak üzere çok çeşitli veri kümelerini destekler:

COCO: 80 nesne kategorisine sahip büyük ölçekli bir nesne algılama, segmentasyon ve altyazı veri kümesi.
LVIS: Daha ince taneli nesne algılama ve segmentasyon için tasarlanmış 1203 nesne kategorisine sahip kapsamlı bir veri kümesi.
Argoverse: Zengin ek açıklamalara sahip kentsel ortamlardan 3B izleme ve hareket tahmini verilerini içeren bir veri kümesi.
VisDrone: Drone ile çekilen görüntülerden nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesi.
SKU-110K: 11K'dan fazla görüntü ile perakende ortamlarında yoğun nesne algılama özelliğine sahiptir.

Bu veri kümeleri sağlam eğitimler almayı kolaylaştırır Ultralytics YOLO çeşitli nesne algılama uygulamaları için modeller.

Ultralytics adresine nasıl yeni bir veri seti ekleyebilirim?

Yeni bir veri setine katkıda bulunmak birkaç adımdan oluşur:

Görüntüleri Toplayın: Kamuya açık veri tabanlarından veya kişisel koleksiyonlardan görseller toplayın.
Görüntülere Açıklama Ekleme: Göreve bağlı olarak sınırlayıcı kutular, segmentler veya anahtar noktalar uygulayın.
Ek Açıklamaları Dışa Aktar: Ek açıklamaları YOLO *.txt format.
Veri Kümesini Düzenle: ile klasör yapısını kullanın train/ ve val/ dizinleri, her biri images/ ve labels/ alt dizinler.
Oluşturmak data.yaml Dosya: Veri kümesi açıklamalarını, sınıfları ve diğer ilgili bilgileri ekleyin.
Görüntüleri Optimize Edin (İsteğe Bağlı): Verimlilik için veri kümesi boyutunu küçültün.
Veri Kümesini Zipleyin: Veri kümesini bir zip dosyasına sıkıştırın.
Belge ve PR: Veri setinizi açıklayın ve Ultralytics Katkı Yönergelerini izleyerek bir Çekme İsteği gönderin.

Kapsamlı bir kılavuz için Yeni Veri Kümelerine Katkıda Bulunun adresini ziyaret edin.

Veri kümem için neden Ultralytics HUB kullanmalıyım?

Ultralytics HUB, veri kümesi yönetimi ve analizi için aşağıdakiler dahil güçlü özellikler sunar:

Sorunsuz Veri Seti Yönetimi: Veri kümelerinizi tek bir yerden yükleyin, düzenleyin ve yönetin.
Anında Eğitim Entegrasyonu: Yüklenen veri kümelerini ek kurulum yapmadan doğrudan model eğitimi için kullanın.
Görselleştirme Araçları: Veri kümesi görüntülerinizi ve ek açıklamalarınızı keşfedin ve görselleştirin.
Veri Kümesi Analizi: Veri kümenizin dağılımı ve özellikleri hakkında bilgi edinin.

Platform, veri kümesi yönetiminden model eğitimine geçişi kolaylaştırarak tüm süreci daha verimli hale getirir. Ultralytics HUB Veri Kümeleri hakkında daha fazla bilgi edinin.

Bilgisayarla görme için Ultralytics YOLO modellerinin benzersiz özellikleri nelerdir?

Ultralytics YOLO modelleri, bilgisayarla görme görevleri için çeşitli benzersiz özellikler sağlar:

Gerçek Zamanlı Performans: Zamana duyarlı uygulamalar için yüksek hızlı çıkarım ve eğitim yetenekleri.
Çok yönlülük: Birleşik bir çerçevede algılama, segmentasyon, sınıflandırma ve poz tahmini görevleri için destek.
Önceden Eğitilmiş Modeller: Çeşitli uygulamalar için yüksek performanslı, önceden eğitilmiş modellere erişim, eğitim süresini kısaltır.
Kapsamlı Topluluk Desteği: Sorun giderme ve geliştirme için aktif topluluk ve kapsamlı belgeler.
Kolay Entegrasyon: Mevcut projeler ve iş akışları ile entegrasyon için basit API.

Ultralytics Modelleri sayfasında YOLO modelleri hakkında daha fazla bilgi edinin.

Ultralytics araçlarını kullanarak bir veri kümesini nasıl optimize edebilir ve sıkıştırabilirim?

Ultralytics araçlarını kullanarak bir veri kümesini optimize etmek ve sıkıştırmak için bu örnek kodu izleyin:

Bir Veri Setini Optimize Etme ve Zipleme

Python

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Bu işlem, daha verimli depolama ve daha yüksek indirme hızları için veri kümesi boyutunu azaltmaya yardımcı olur. Bir Veri Kümesini Optimize Etme ve Zipleme hakkında daha fazla bilgi edinin.

📅1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi