Meet YOLO26: next-gen vision AI.

YOLO26 Eğitim Reçetesi

Giriş

This guide documents the exact training recipe used to produce the official YOLO26 pretrained checkpoints on COCO. Every hyperparameter shown here is already embedded in the released .pt weights and can be inspected programmatically.

Understanding how the base models were trained helps you make better decisions when fine-tuning: which data augmentations to keep, which loss function weights to adjust, and what optimizer settings work best for your dataset size.

Bu rehber kimin için?

Bu kılavuz, resmi YOLO26 kontrol noktalarının neleri içerdiğini anlamak isteyen uygulayıcılar içindir; sadece mimariyi değil, aynı zamanda performanslarını şekillendiren öğrenme oranı programlarını, artırma ardışık düzenlerini ve kayıp ağırlıklarını da kapsar. Kendi verilerin üzerinde ince ayar yaparken bilinçli tercihlerde bulunmak için bu bilgileri kullan.

Eğitim Argümanlarını İnceleme

Her Ultralytics kontrol noktası, onu üretmek için kullanılan tam eğitim yapılandırmasını depolar. Bu ayarları dilediğin zaman inceleyebilirsin:

Kontrol noktası eğitim argümanlarını incele
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
print(model.ckpt["train_args"])

Bu yöntem, resmi sürümlerden kendi ince ayar yaptığın modellere kadar tüm .pt kontrol noktaları için çalışır. Yapılandırılabilir eğitim argümanlarının tam listesi için eğitim yapılandırması referansına göz at.

Eğitime Genel Bakış

Tüm YOLO26 temel modelleri, yığın boyutu 128 ile MuSGD iyileştiricisi kullanılarak 640x640 çözünürlükte COCO üzerinde eğitilmiştir. Modeller, orta düzey ön eğitimli ağırlıklardan başlatılmış ve evrimsel arama yoluyla bulunan hiperparametrelerle iyileştirilmiştir. Her model boyutu için tam eğitim günlükleri ve metrikleri Ultralytics Platform üzerinde mevcuttur:

Tüm boyutlardaki temel tasarım tercihleri:

  • NMS'siz bire bir başlık ile Uçtan uca eğitim (end2end=True)
  • Konvolüsyon ağırlıkları için Muon tarzı ortogonal güncellemelerle SGD'yi birleştiren MuSGD iyileştiricisi
  • Heavy mosaic augmentation (~0.9-1.0 probability) disabled in the last 10 epochs (close_mosaic=10)
  • Farklı boyutlardaki nesneleri işlemek için Agresif ölçek artırma (0.56-0.95)
  • Geometrik bozulmayı düşük tutmak için çoğu boyutta Minimum döndürme/kaydırma

Model Boyutuna Göre Hiperparametreler

İyileştirici ve Öğrenme Oranı

AyarNSMLX
optimizerMuSGDMuSGDMuSGDMuSGDMuSGD
lr00.00540.000380.000380.000380.00038
lrf0.04950.8820.8820.8820.882
momentum0.9470.9480.9480.9480.948
weight_decay0.000640.000270.000270.000270.00027
warmup_epochs0.980.990.990.990.99
epochs24570806040
batch128128128128128
imgsz640640640640640
Öğrenme oranı stratejisi

N modeli, keskin bir düşüş (lrf=0.0495) ile daha yüksek bir başlangıç öğrenme oranı kullanırken, S/M/L/X modelleri daha yumuşak bir program (lrf=0.882) ile çok daha düşük bir başlangıç LR'si kullanmıştır. Bu durum, daha küçük ve daha büyük modellerin farklı yakınsama dinamiklerini yansıtır; küçük modeller etkili bir şekilde öğrenmek için daha agresif güncellemelere ihtiyaç duyar.

Kayıp Ağırlıkları

AyarNSMLX
box5.639.839.839.839.83
cls0.560.650.650.650.65
dfl9.040.960.960.960.96

N modeli DFL kaybına öncelik verirken, S/M/L/X modelleri vurguyu sınırlayıcı kutu regresyonuna kaydırır. Sınıflandırma kaybı tüm boyutlarda nispeten tutarlı kalır.

Artırma Ardışık Düzeni

Her tekniğin ayrıntılı açıklaması için YOLO Veri Artırma kılavuzuna bak.

AyarNSMLX
mosaic0.9090.9920.9920.9920.992
mixup0.0120.050.4270.4270.427
copy_paste0.0750.4040.3040.4040.404
scale0.5620.90.950.950.95
fliplr0.6060.3040.3040.3040.304
degrees1.11~0~0~0~0
shear1.46~0~0~0~0
translate0.0710.2750.2750.2750.275
hsv_h0.0140.0130.0130.0130.013
hsv_s0.6450.3530.3530.3530.353
hsv_v0.5660.1940.1940.1940.194
bgr0.1060.00.00.00.0

Daha büyük modeller genel olarak daha agresif artırma (daha yüksek mixup, copy-paste ve scale) kullanır, çünkü daha fazla kapasiteye sahiptirler ve daha güçlü düzenlileştirmeden faydalanırlar. N modeli, anlamlı döndürme, kaydırma ve BGR artırmasına sahip tek boyuttur.

Dahili Eğitim Parametreleri

Gelişmiş: dahili ardışık düzen parametreleri

Kontrol noktaları ayrıca, dahili eğitim ardışık düzeninde kullanılan ancak default.yaml dosyasında kullanıcı tarafından yapılandırılabilir ayarlar olarak açıkça belirtilmeyen parametreleri de içerir:

AyarAçıklamaNSMLX
muon_wMuSGD'deki Muon güncelleme ağırlığı0.5280.4360.4360.4360.436
sgd_wMuSGD'deki SGD güncelleme ağırlığı0.6740.4790.4790.4790.479
cls_wDahili sınıflandırma ağırlığı2.743.483.483.483.48
o2mBire çok başlık kayıp ağırlığı1.00.7050.7050.7050.705
topkEn iyi-k etiket ataması85555

Bunlar yeniden üretilebilirlik için kaydedilmiştir ancak ince ayar yaparken ayarlanmaları gerekmez. Daha fazla ayrıntı için SSS kısmına bak.

İnce Ayar Rehberi

YOLO26 üzerinde kendi veri setinle ince ayar yaparken tam ön eğitim tarifini tekrarlamana gerek yoktur. Önceden eğitilmiş ağırlıklar, COCO eğitiminden gelen artırma ve optimizasyon bilgisini zaten barındırır. Daha genel eğitim en iyi uygulamaları için Model Eğitimi İçin İpuçları kısmına bak.

Basit Başla

Varsayılan ayarlarla ince ayar yap
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
results = model.train(data="your-dataset.yaml", epochs=100, imgsz=640)

Varsayılan ayarlarla ince ayar yapmak güçlü bir temel oluşturur. Sadece özel bir nedenin varsa hiperparametreleri ayarla.

Ne Zaman Ayarlanmalı

Küçük veri setleri (< 1.000 görsel):

  • Artırma gücünü azalt: mosaic=0.5, mixup=0.0, copy_paste=0.0
  • Öğrenme oranını düşür: lr0=0.001
  • Daha az dönem ve sabır kullan: epochs=50, patience=20
  • Omurga katmanlarını dondurmayı düşün: freeze=10

Büyük veri setleri (> 50.000 görsel):

  • Ön eğitim tarifine daha yakın kal
  • Daha uzun çalışmalar için optimizer=MuSGD kullanmayı düşün
  • Artırmayı artır: mosaic=1.0, mixup=0.3, scale=0.9

Alana özgü görseller (hava, tıbbi, su altı):

  • Dikey yönelim değişkenlik gösteriyorsa flipud=0.5 değerini artır
  • Nesneler rastgele açılarda görünüyorsa degrees değerini artır
  • Aydınlatma koşulları COCO'dan önemli ölçüde farklıysa hsv_s ve hsv_v değerlerini ayarla

Otomatik hiperparametre optimizasyonu için Hiperparametre Ayarlama rehberine bak.

Model Boyutu Seçme

ModelEn İyi KullanımYığın Boyutu Rehberi
YOLO26nUç cihazlar, mobil, CPU'da gerçek zamanlıTüketici GPU'larında büyük yığınlar (64-128)
YOLO26sDengeli hız ve doğrulukOrta boy yığınlar (32-64)
YOLO26mOrta düzey hesaplama ile daha yüksek doğrulukDaha küçük yığınlar (16-32)
YOLO26lGPU mevcut olduğunda yüksek doğrulukKüçük yığınlar (8-16) veya çoklu GPU
YOLO26xMaksimum doğruluk, sunucu dağıtımıKüçük yığınlar (4-8) veya çoklu GPU

Dışa aktarma ve dağıtım seçenekleri için Dışa Aktarma rehberine ve Model Dağıtım Seçenekleri kısmına bak.

SSS

Herhangi bir kontrol noktası için kullanılan tam hiperparametreleri nasıl görebilirim?

Kontrol noktasını torch.load() ile yükle ve train_args anahtarına eriş ya da Ultralytics API ile model.ckpt["train_args"] kullan. Tam örnekler için Eğitim Argümanlarını İnceleme kısmına bak.

Dönem sayıları neden her model boyutu için farklı?

Daha büyük modeller daha fazla kapasiteye sahip oldukları için COCO üzerinde daha hızlı yakınsar. N modeli 245 döneme ihtiyaç duyarken X modeli sadece 40 döneme ihtiyaç duydu. Kendi veri setinde ince ayar yaparken, en uygun dönem sayısı model boyutuna değil, veri setinin boyutuna ve karmaşıklığına bağlıdır. Doğru durma noktasını otomatik olarak bulmak için erken durdurma (patience) kullan.

İnce ayar için MuSGD kullanmalı mıyım?

optimizer=auto (varsayılan) olduğunda, Ultralytics daha uzun eğitim süreçleri (>10.000 iterasyon) için otomatik olarak MuSGD, daha kısa süreçler için ise AdamW seçer. İstersen optimizer=MuSGD olarak açıkça ayarlayabilirsin. Optimizasyon seçimi hakkında daha fazla bilgi için eğitim dokümantasyonuna bak.

Kontrol noktasındaki muon_w, sgd_w, cls_w, o2m ve topk nedir?

Bunlar temel kontrol noktalarını oluşturan eğitim hattından gelen dahili parametrelerdir. Yeniden üretilebilirlik için saklanırlar ancak default.yaml içinde kullanıcı tarafından yapılandırılabilir ayarlar değildir. İnce ayar yaparken bunları ayarlamana gerek yoktur. Ayrıntılar için Dahili Eğitim Parametreleri kısmına bak.

Tam ön eğitimi sıfırdan tekrarlayabilir miyim?

Kontrol noktaları, halka açık kod tabanında bulunmayan ek özelliklere (yapılandırılabilir o2m ağırlıkları ve cls_w gibi) sahip dahili bir eğitim dalı kullanılarak üretilmiştir. Halka açık Ultralytics paketi ile bu sayfada belgelenen hiperparametreleri kullanarak çok yakın sonuçlar elde edebilirsin ancak tam bir yeniden üretim için dahili dal gereklidir.

Yorumlar