İçeriğe geç

Veri Kümeleri

Ultralytics Platform veri kümeleri, eğitim verilerinizi yönetmek için kolaylaştırılmış bir çözüm sunar. Yüklendikten sonra, veri kümeleri otomatik işleme ve istatistik üretimi ile model eğitimi için hemen kullanılabilir.

Veri Kümesi Yükleme

Ultralytics , esneklik sağlamak için birden fazla yükleme formatını kabul eder.

Desteklenen Görüntü Formatları

FormatUzantılarNotlar
JPEG.jpg, .jpegEn yaygın, önerilen
PNG.pngŞeffaflığı destekler
WebP.webpModern, iyi sıkıştırma
BMP.bmpSıkıştırılmamış
GIF.gifİlk kare çıkarıldı
TIFF.tiff, .tifYüksek kalite
HEIC.heiciPhone fotoğrafları
AVIF.avifYeni nesil format
JP2.jp2JPEG 2000
DNG.dngHam kamera

Desteklenen Video Formatları

Videolar otomatik olarak karelere ayrılır:

FormatUzantılarÇıkarma
MP4.mp41 FPS, maksimum 100 kare
WebM.webm1 FPS, maksimum 100 kare
MOV.mov1 FPS, maksimum 100 kare
AVI.avi1 FPS, maksimum 100 kare
MKV.mkv1 FPS, maksimum 100 kare
M4V.m4v1 FPS, maksimum 100 kare

Dosya Boyutu Sınırları

TürMaksimum Boyut
GörüntülerHer biri 50 MB
VideolarHer biri 1 GB
ZIP dosyaları50 GB

Arşivler

50 GB'a kadar ZIP dosyaları, klasör yapısı korunarak ve otomatik olarak çıkarılma ve işleme ile desteklenir.

Veri Kümenizi Hazırlama

Etiketli veri kümeleri için standart YOLO formatını kullanın:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

YAML dosyası, veri kümesi yapılandırmanızı tanımlar:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Yükleme Süreci

  1. Kenar çubuğundaki Veri Kümeleri bölümüne gidin
  2. Veri Kümesi Yükle'ye tıklayın veya dosyaları yükleme alanına sürükleyin
  3. Görev türünü seçin (detect, segment, pose, obb, classify)
  4. Bir ad ve isteğe bağlı bir açıklama ekleyin
  5. Yükle'ye tıklayın

Yüklemeden sonra, Platform verilerinizi işler:

  1. Normalizasyon: Büyük görüntüler yeniden boyutlandırılır (maks. 4096 piksel)
  2. Küçük Resimler: 256 piksel önizlemeler oluşturuldu
  3. Etiket Ayrıştırma: YOLO formatındaki etiketler çıkarıldı
  4. İstatistikler: Sınıf dağılımları hesaplandı
Yüklemeden Önce Doğrula

Veri setinizi yüklemeden önce yerel olarak doğrulayabilirsiniz:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Görüntülere Göz At

Veri seti görsellerinizi birden fazla düzende görüntüleyin:

GörünümAçıklama
IzgaraEk açıklama katmanlarına sahip küçük resim ızgarası
KompaktHızlı tarama için daha küçük küçük resimler
TabloDosya adı, boyutlar ve etiket sayılarını içeren liste

Tam Ekran Görüntüleyici

Tam ekran görüntüleyiciyi açmak için herhangi bir görsele tıklayın, şunları içerir:

  • Gezinme: Göz atmak için ok tuşları veya tıklama
  • Meta Veriler: Dosya adı, boyutlar, bölme, etiket sayısı
  • Ek Açıklamalar: Ek açıklama görünürlüğünü aç/kapa
  • Sınıf Dağılımı: Sınıf başına etiket sayıları

Bölüme Göre Filtrele

Görselleri veri seti bölmelerine göre filtreleyin:

BölmeAmaç
EğitModel eğitimi için kullanılır
DoğrulaEğitim sırasında doğrulama için kullanılır
TestNihai değerlendirme için kullanılır
BilinmiyorBölme atanmadı

Veri Kümesi İstatistikleri

The İstatistikler sekmesi, veri setinizin otomatik analizini sağlar:

Sınıf Dağılımı

Sınıf başına ek açıklama sayısını gösteren çubuk grafik:

Konum Isı Haritası

Ek açıklamaların görüntülerde nerede göründüğünün görselleştirmesi:

Boyut Analizi

Görüntü boyutlarının (genişlik ve yükseklik) dağılım grafiği:

İstatistik Önbellekleme

İstatistikler 5 dakika boyunca önbelleğe alınır. Ek açıklamalardaki değişiklikler, önbellek süresi dolduktan sonra yansıtılacaktır.

Veri Kümesini Dışa Aktar

Veri setinizi çevrimdışı kullanım için NDJSON formatında dışa aktarın:

  1. Veri seti eylemleri menüsünü açın
  2. Dışa Aktar'a tıklayın
  3. NDJSON dosyasını indirin

NDJSON formatı, her satırda bir JSON nesnesi depolar:

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

Tam özellikler için Ultralytics NDJSON formatı belgelerine bakın.

Veri Kümesi URI'si

Platform veri setlerine şunları kullanarak referans verin: ul:// URI formatı:

ul://username/datasets/dataset-slug

Modelleri her yerden eğitmek için bu URI'yi kullanın:

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Platform Verileriyle Her Yerde Eğitim Yapın

ul:// URI her ortamdan çalışır:

  • Yerel makine: Kendi donanımınızda eğitim yapın, veriler otomatik olarak indirilir
  • Google Colab: Platform veri setlerinize not defterlerinde erişin
  • Uzak sunucular: Tam veri seti erişimiyle bulut VM'lerinde eğitim yapın

Görünürlük Ayarları

Veri setinizi kimlerin görebileceğini kontrol edin:

AyarAçıklama
ÖzelSadece siz erişebilirsiniz
Herkese AçıkHerkes Keşfet sayfasında görüntüleyebilir

Görünürlüğü değiştirmek için:

  1. Veri kümesi eylemleri menüsünü açın
  2. Düzenle'ye tıklayın
  3. Görünürlük ayarını değiştirin
  4. Kaydet'e tıklayın

Veri Kümesini Düzenle

Veri kümesi adını, açıklamasını veya görünürlüğünü güncelleyin:

  1. Veri kümesi eylemleri menüsünü açın
  2. Düzenle'ye tıklayın
  3. Değişiklikleri yapın
  4. Kaydet'e tıklayın

Veri Kümesini Sil

Artık ihtiyacınız olmayan bir veri kümesini silin:

  1. Veri kümesi eylemleri menüsünü açın
  2. Sil'e tıklayın
  3. Silme işlemini onaylayın

Çöp Kutusu ve Geri Yükleme

Silinen veri kümeleri 30 gün boyunca Çöp Kutusu'na taşınır. Bunları Ayarlar'daki Çöp Kutusu sayfasından geri yükleyebilirsiniz.

Veri Kümesi Üzerinde Eğitim

Doğrudan veri kümenizden eğitime başlayın:

  1. Veri kümesi sayfasında Modeli Eğit'e tıklayın
  2. Bir proje seçin veya yeni bir proje oluşturun
  3. Eğitim parametrelerini yapılandırın
  4. Eğitime başlayın

Ayrıntılar için Bulut Eğitimi'ne bakın.

SSS

Yüklemeden sonra verilerime ne olur?

Verileriniz seçtiğiniz bölgede (ABD, AB veya AP) işlenir ve depolanır. Görüntüler:

  1. Biçim ve boyut için doğrulanmıştır
  2. 4096 pikselden büyükse normalleştirilir (en boy oranı korunarak)
  3. SHA-256 hashleme ile İçerik Adreslenebilir Depolama (CAS) kullanılarak depolanır
  4. Hızlı göz atma için 256 pikselde küçük resimler oluşturulur

Depolama nasıl çalışır?

Ultralytics Platformu, verimli depolama için İçerik Adreslenebilir Depolama (CAS) kullanır:

  • Tekilleştirme: Farklı kullanıcılar tarafından yüklenen aynı görüntüler yalnızca bir kez depolanır
  • Bütünlük: SHA-256 hashleme, veri bütünlüğünü sağlar
  • Verimlilik: Depolama maliyetlerini azaltır ve işlemeyi hızlandırır
  • Bölgesel: Veriler seçtiğiniz bölgede (ABD, AB veya AP) kalır

Mevcut bir veri kümesine görüntü ekleyebilir miyim?

Evet, ek görüntüler yüklemek için veri kümesi sayfasındaki Görüntü Ekle düğmesini kullanın. Yeni istatistikler otomatik olarak hesaplanacaktır.

Görüntüleri veri kümeleri arasında nasıl taşırım?

Toplu seçim özelliğini kullanın:

  1. Galerideki görüntüleri seçin
  2. Taşı veya Kopyala'ya tıklayın
  3. Hedef veri kümesini seçin

Hangi etiket formatları desteklenmektedir?

Ultralytics Platformu, YOLO formatındaki etiketleri destekler:

GörevFormatÖrnek
Tespit Etclass cx cy w h0 0.5 0.5 0.2 0.3
Segmentclass x1 y1 x2 y2 ...0 0.1 0.1 0.9 0.1 0.9 0.9
Pozclass cx cy w h kx1 ky1 v1 ...0 0.5 0.5 0.2 0.3 0.6 0.7 2
OBBclass x1 y1 x2 y2 x3 y3 x4 y40 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9
SınıflandırDizin yapısıtrain/cats/, train/dogs/

Tüm koordinatlar normalleştirilmiştir (0-1 aralığı). Poz görünürlük bayrakları: 0=etiketlenmemiş, 1=etiketlenmiş ancak gizlenmiş, 2=etiketlenmiş ve görünür.



📅 20 gün önce oluşturuldu ✏️ 12 gün önce güncellendi
glenn-jocherLaughing-q

Yorumlar