Veri Kümeleri
Ultralytics Platform veri kümeleri, eğitim verilerinizi yönetmek için kolaylaştırılmış bir çözüm sunar. Yüklendikten sonra, veri kümeleri otomatik işleme ve istatistik üretimi ile model eğitimi için hemen kullanılabilir.
Veri Kümesi Yükleme
Ultralytics , esneklik sağlamak için birden fazla yükleme formatını kabul eder.
Desteklenen Görüntü Formatları
| Format | Uzantılar | Notlar |
|---|---|---|
| JPEG | .jpg, .jpeg | En yaygın, önerilen |
| PNG | .png | Şeffaflığı destekler |
| WebP | .webp | Modern, iyi sıkıştırma |
| BMP | .bmp | Sıkıştırılmamış |
| GIF | .gif | İlk kare çıkarıldı |
| TIFF | .tiff, .tif | Yüksek kalite |
| HEIC | .heic | iPhone fotoğrafları |
| AVIF | .avif | Yeni nesil format |
| JP2 | .jp2 | JPEG 2000 |
| DNG | .dng | Ham kamera |
Desteklenen Video Formatları
Videolar otomatik olarak karelere ayrılır:
| Format | Uzantılar | Çıkarma |
|---|---|---|
| MP4 | .mp4 | 1 FPS, maksimum 100 kare |
| WebM | .webm | 1 FPS, maksimum 100 kare |
| MOV | .mov | 1 FPS, maksimum 100 kare |
| AVI | .avi | 1 FPS, maksimum 100 kare |
| MKV | .mkv | 1 FPS, maksimum 100 kare |
| M4V | .m4v | 1 FPS, maksimum 100 kare |
Dosya Boyutu Sınırları
| Tür | Maksimum Boyut |
|---|---|
| Görüntüler | Her biri 50 MB |
| Videolar | Her biri 1 GB |
| ZIP dosyaları | 50 GB |
Arşivler
50 GB'a kadar ZIP dosyaları, klasör yapısı korunarak ve otomatik olarak çıkarılma ve işleme ile desteklenir.
Veri Kümenizi Hazırlama
Etiketli veri kümeleri için standart YOLO formatını kullanın:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
YAML dosyası, veri kümesi yapılandırmanızı tanımlar:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
Yükleme Süreci
- Kenar çubuğundaki Veri Kümeleri bölümüne gidin
- Veri Kümesi Yükle'ye tıklayın veya dosyaları yükleme alanına sürükleyin
- Görev türünü seçin (detect, segment, pose, obb, classify)
- Bir ad ve isteğe bağlı bir açıklama ekleyin
- Yükle'ye tıklayın
Yüklemeden sonra, Platform verilerinizi işler:
- Normalizasyon: Büyük görüntüler yeniden boyutlandırılır (maks. 4096 piksel)
- Küçük Resimler: 256 piksel önizlemeler oluşturuldu
- Etiket Ayrıştırma: YOLO formatındaki etiketler çıkarıldı
- İstatistikler: Sınıf dağılımları hesaplandı
Yüklemeden Önce Doğrula
Veri setinizi yüklemeden önce yerel olarak doğrulayabilirsiniz:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Görüntülere Göz At
Veri seti görsellerinizi birden fazla düzende görüntüleyin:
| Görünüm | Açıklama |
|---|---|
| Izgara | Ek açıklama katmanlarına sahip küçük resim ızgarası |
| Kompakt | Hızlı tarama için daha küçük küçük resimler |
| Tablo | Dosya adı, boyutlar ve etiket sayılarını içeren liste |
Tam Ekran Görüntüleyici
Tam ekran görüntüleyiciyi açmak için herhangi bir görsele tıklayın, şunları içerir:
- Gezinme: Göz atmak için ok tuşları veya tıklama
- Meta Veriler: Dosya adı, boyutlar, bölme, etiket sayısı
- Ek Açıklamalar: Ek açıklama görünürlüğünü aç/kapa
- Sınıf Dağılımı: Sınıf başına etiket sayıları
Bölüme Göre Filtrele
Görselleri veri seti bölmelerine göre filtreleyin:
| Bölme | Amaç |
|---|---|
| Eğit | Model eğitimi için kullanılır |
| Doğrula | Eğitim sırasında doğrulama için kullanılır |
| Test | Nihai değerlendirme için kullanılır |
| Bilinmiyor | Bölme atanmadı |
Veri Kümesi İstatistikleri
The İstatistikler sekmesi, veri setinizin otomatik analizini sağlar:
Sınıf Dağılımı
Sınıf başına ek açıklama sayısını gösteren çubuk grafik:
Konum Isı Haritası
Ek açıklamaların görüntülerde nerede göründüğünün görselleştirmesi:
Boyut Analizi
Görüntü boyutlarının (genişlik ve yükseklik) dağılım grafiği:
İstatistik Önbellekleme
İstatistikler 5 dakika boyunca önbelleğe alınır. Ek açıklamalardaki değişiklikler, önbellek süresi dolduktan sonra yansıtılacaktır.
Veri Kümesini Dışa Aktar
Veri setinizi çevrimdışı kullanım için NDJSON formatında dışa aktarın:
- Veri seti eylemleri menüsünü açın
- Dışa Aktar'a tıklayın
- NDJSON dosyasını indirin
NDJSON formatı, her satırda bir JSON nesnesi depolar:
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
Tam özellikler için Ultralytics NDJSON formatı belgelerine bakın.
Veri Kümesi URI'si
Platform veri setlerine şunları kullanarak referans verin: ul:// URI formatı:
ul://username/datasets/dataset-slug
Modelleri her yerden eğitmek için bu URI'yi kullanın:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
Platform Verileriyle Her Yerde Eğitim Yapın
ul:// URI her ortamdan çalışır:
- Yerel makine: Kendi donanımınızda eğitim yapın, veriler otomatik olarak indirilir
- Google Colab: Platform veri setlerinize not defterlerinde erişin
- Uzak sunucular: Tam veri seti erişimiyle bulut VM'lerinde eğitim yapın
Görünürlük Ayarları
Veri setinizi kimlerin görebileceğini kontrol edin:
| Ayar | Açıklama |
|---|---|
| Özel | Sadece siz erişebilirsiniz |
| Herkese Açık | Herkes Keşfet sayfasında görüntüleyebilir |
Görünürlüğü değiştirmek için:
- Veri kümesi eylemleri menüsünü açın
- Düzenle'ye tıklayın
- Görünürlük ayarını değiştirin
- Kaydet'e tıklayın
Veri Kümesini Düzenle
Veri kümesi adını, açıklamasını veya görünürlüğünü güncelleyin:
- Veri kümesi eylemleri menüsünü açın
- Düzenle'ye tıklayın
- Değişiklikleri yapın
- Kaydet'e tıklayın
Veri Kümesini Sil
Artık ihtiyacınız olmayan bir veri kümesini silin:
- Veri kümesi eylemleri menüsünü açın
- Sil'e tıklayın
- Silme işlemini onaylayın
Çöp Kutusu ve Geri Yükleme
Silinen veri kümeleri 30 gün boyunca Çöp Kutusu'na taşınır. Bunları Ayarlar'daki Çöp Kutusu sayfasından geri yükleyebilirsiniz.
Veri Kümesi Üzerinde Eğitim
Doğrudan veri kümenizden eğitime başlayın:
- Veri kümesi sayfasında Modeli Eğit'e tıklayın
- Bir proje seçin veya yeni bir proje oluşturun
- Eğitim parametrelerini yapılandırın
- Eğitime başlayın
Ayrıntılar için Bulut Eğitimi'ne bakın.
SSS
Yüklemeden sonra verilerime ne olur?
Verileriniz seçtiğiniz bölgede (ABD, AB veya AP) işlenir ve depolanır. Görüntüler:
- Biçim ve boyut için doğrulanmıştır
- 4096 pikselden büyükse normalleştirilir (en boy oranı korunarak)
- SHA-256 hashleme ile İçerik Adreslenebilir Depolama (CAS) kullanılarak depolanır
- Hızlı göz atma için 256 pikselde küçük resimler oluşturulur
Depolama nasıl çalışır?
Ultralytics Platformu, verimli depolama için İçerik Adreslenebilir Depolama (CAS) kullanır:
- Tekilleştirme: Farklı kullanıcılar tarafından yüklenen aynı görüntüler yalnızca bir kez depolanır
- Bütünlük: SHA-256 hashleme, veri bütünlüğünü sağlar
- Verimlilik: Depolama maliyetlerini azaltır ve işlemeyi hızlandırır
- Bölgesel: Veriler seçtiğiniz bölgede (ABD, AB veya AP) kalır
Mevcut bir veri kümesine görüntü ekleyebilir miyim?
Evet, ek görüntüler yüklemek için veri kümesi sayfasındaki Görüntü Ekle düğmesini kullanın. Yeni istatistikler otomatik olarak hesaplanacaktır.
Görüntüleri veri kümeleri arasında nasıl taşırım?
Toplu seçim özelliğini kullanın:
- Galerideki görüntüleri seçin
- Taşı veya Kopyala'ya tıklayın
- Hedef veri kümesini seçin
Hangi etiket formatları desteklenmektedir?
Ultralytics Platformu, YOLO formatındaki etiketleri destekler:
| Görev | Format | Örnek |
|---|---|---|
| Tespit Et | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| Segment | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| Poz | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| Sınıflandır | Dizin yapısı | train/cats/, train/dogs/ |
Tüm koordinatlar normalleştirilmiştir (0-1 aralığı). Poz görünürlük bayrakları: 0=etiketlenmemiş, 1=etiketlenmiş ancak gizlenmiş, 2=etiketlenmiş ve görünür.