YOLO26 ve YOLOv5: Mimari, Hız ve Kullanım Senaryoları Karşılaştırması
Nesne algılama modellerinin evrimi hızlı ve dönüştürücü olmuştur. Bu karşılaştırmada, Ultralytics YOLO26 ve Ultralytics YOLOv5'in belirgin özelliklerini inceleyerek, mimari ve eğitim metodolojilerindeki gelişmelerin yeteneklerini nasıl şekillendirdiğini araştırıyoruz. YOLOv5 bilgisayar görüşü topluluğunda temel bir sütun olmaya devam ederken, yeni piyasaya sürülen YOLO26, yeni nesil uç dağıtımı ve yüksek hızlı çıkarım için tasarlanmış çığır açan verimlilikler sunmaktadır.
Modele Genel Bakış
Her iki model de YOLO (You Only Look Once) mimarisinin tarihinde önemli kilometre taşlarını temsil etmektedir. Gerçek zamanlı performans ve kullanım kolaylığı taahhüdünü paylaşsalar da, yapay zeka gelişiminin biraz farklı dönemlerine hizmet etmektedirler.
Ultralytics YOLO26
YOLO26, Ultralytics'in Ocak 2026'da piyasaya sürülen en son sürümüdür. Non-Maximum Suppression (NMS) son işleme ihtiyacını ortadan kaldıran, doğal olarak uçtan uca mimarilere doğru bir geçişi temsil eder. Uç bilişim göz önünde bulundurularak tasarlanmış olup, doğruluk sınırlarını zorlarken dağıtımı basitleştirir.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2026-01-14
- Belgeler:YOLO26 Dokümantasyonu
- Temel Yenilik: Uçtan uca NMS-free algılama, DFL kaldırma ve MuSGD optimize edici.
YOLO26 hakkında daha fazla bilgi edinin
Ultralytics YOLOv5
YOLOv5, 2020 ortalarında piyasaya sürüldü ve hızı, doğruluğu ve kullanıcı dostu mühendisliği dengesiyle hızla endüstri standardı haline geldi. PyTorch ekosistemini milyonlarca geliştiriciye tanıttı ve istikrar ile eski sistem desteğinin çok önemli olduğu üretim ortamlarında yaygın olarak kullanılmaya devam ediyor.
- Yazar: Glenn Jocher
- Kuruluş:Ultralytics
- Tarih: 2020-06-26
- Belgeler:YOLOv5 Belgeleri
- Temel Yenilik: Kullanıcı dostu PyTorch uygulaması, mozaik artırma ve otomatik çapa mekanizmaları.
YOLOv5 hakkında daha fazla bilgi edinin.
Mimari Farklılıklar
YOLOv5'ten YOLO26'ya geçiş, nesnelerin nasıl algılandığı ve modelin eğitim sırasında nasıl optimize edildiği konusunda temel değişiklikleri içerir.
Uçtan Uca vs. Son İşleme
YOLOv5, yinelenen sınırlayıcı kutuları filtrelemek için Non-Maximum Suppression (NMS)'a dayanır. Etkili olsa da, NMS, özellikle sınırlı CPU döngülerine sahip uç cihazlarda çıkarım sırasında bir darboğaz olabilen sezgisel bir süreçtir. Belirli veri kümeleri için ayarlanması gereken IoU eşikleri gibi hiperparametreler sunar.
Buna karşılık, YOLO26 doğal olarak uçtan ucadır. YOLOv10'da öncülük edilen bir tasarımı benimseyerek, YOLO26, NMS gerektirmeden nesnelerin tam kümesini doğrudan ağ çıktısından tahmin eder. Bu, model çıktısı nihai sonuç olduğu için dağıtım hattını önemli ölçüde basitleştirir.
Dağıtım Kolaylığı
YOLO26'da NMS'nin kaldırılması, CoreML veya TensorRT gibi formatlara dışa aktarırken karmaşık son işleme adımlarını derlemenize artık gerek olmadığı anlamına gelir. Ham model çıktısı kullanıma hazırdır, bu da gecikmeyi ve entegrasyon karmaşıklığını azaltır.
Kayıp Fonksiyonları ve Optimizasyon
YOLO26, ProgLoss (Aşamalı Kayıp Dengeleme) ve STAL (Küçük Hedefe Duyarlı Etiket Ataması) özelliklerini sunar. Bu yenilikler, hava görüntülerinde veya dağınık sahnelerde küçük nesneleri algılamadaki zorluk gibi nesne algılamadaki yaygın zayıflıkları özel olarak hedefler. ProgLoss, yakınsamayı stabilize etmek için eğitim sırasında farklı kayıp bileşenlerinin ağırlığını dinamik olarak ayarlar.
Ayrıca, YOLO26, Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenen SGD ve Muon optimize edicinin bir melezi olan MuSGD optimize ediciyi kullanır. Bu, LLM eğitiminin kararlılığını bilgisayar görüşüne getirerek daha hızlı yakınsama ve daha sağlam ağırlıklar sağlar.
Basitleştirilmiş Başlık Mimarisi
YOLO26'daki önemli bir değişiklik, Distribution Focal Loss (DFL)'un kaldırılmasıdır. DFL, YOLOv8 gibi önceki yinelemelerde kutu hassasiyetine yardımcı olsa da, dışa aktarım sırasında hesaplama yükü ve karmaşıklık ekliyordu. Regresyon kaybını iyileştirerek, YOLO26 DFL olmadan yüksek hassasiyet elde eder ve önceki nesillere kıyasla CPU'larda %43'e kadar daha hızlı çalışır, bu da uç yapay zeka uygulamaları için kritik bir ölçüttür.
Performans Metrikleri Karşılaştırması
Aşağıdaki tablo, YOLO26 ve YOLOv5'in COCO veri kümesi üzerindeki performansını karşılaştırmaktadır. YOLO26, özellikle mimari optimizasyonlarının öne çıktığı CPU donanımında hem doğruluk (mAP) hem de çıkarım hızında önemli kazanımlar göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Temel Çıkarımlar
- Doğruluk Sıçraması: YOLO26n (Nano), 28.0 mAP'deki YOLOv5n'i önemli ölçüde geride bırakarak 40.9 mAP elde eder. Bu, kullanıcıların algılama kalitesinden ödün vermeden daha küçük modeller dağıtmasına olanak tanır.
- CPU Verimliliği: YOLO26'daki mimari basitleştirme, önemli ölçüde daha hızlı CPU çıkarımı sağlar. Örneğin, YOLO26n CPU'da ~39ms'de çalışırken, YOLOv5n için bu süre ~74ms'dir, bu da onu raspberry pi veya mobil dağıtımlar için ideal kılar.
- Parametre Verimliliği: YOLO26, birçok durumda daha az parametreyle daha yüksek doğruluk elde eder (örn. YOLO26l'nin 24.8M parametresi varken YOLOv5l'nin 53.2M parametresi vardır), bu da eğitim ve çıkarım sırasında bellek ayak izini azaltır.
Eğitim ve Ekosistem
Her iki model de sağlam Ultralytics ekosisteminden faydalanır, ancak YOLO26 daha yeni araçları ve daha derin entegrasyonları kullanır.
Kullanım Kolaylığı ve API
Her iki model de birleşik ultralytics Python paketi kullanır (YOLOv5 başlangıçta bağımsızdı ancak şimdi entegre edilmiştir). Bu, aralarında geçiş yapmanın bir model adı dizesini değiştirmek kadar basit olmasını sağlar.
from ultralytics import YOLO
# Load YOLO26 for state-of-the-art performance
model_26 = YOLO("yolo26n.pt")
model_26.train(data="coco8.yaml", epochs=100)
# Load YOLOv5 for legacy comparison
model_v5 = YOLO("yolov5nu.pt")
model_v5.train(data="coco8.yaml", epochs=100)
Gelişmiş Eğitim Özellikleri
YOLO26, geliştirilmiş veri artırma stratejilerini ve YOLOv5'te kullanılan standart SGD'den daha etkili bir şekilde yerel minimumlardan kaçmaya yardımcı olan yeni MuSGD optimize ediciyi destekler. Ayrıca YOLO26, poz tahmini için Kalıntı Log-Olasılık Tahmini (RLE) ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) görevleri için özel açı kayıpları gibi görev odaklı iyileştirmeler sunar; bu özellikler YOLOv5 döneminde ya yoktu ya da daha az gelişmişti.
Kullanıcılar ayrıca veri kümelerini yönetmek, modelleri bulutta eğitmek ve çeşitli uç noktalara sorunsuz bir şekilde dağıtmak için Ultralytics Platformu'ndan yararlanabilirler.
İdeal Kullanım Senaryoları
YOLO26 Ne Zaman Seçilmeli
YOLO26, üstün doğruluk-gecikme oranı nedeniyle neredeyse tüm yeni projeler için önerilen seçimdir.
- Uç Yapay Zeka ve IoT: DFL kaldırma ve NMS'siz çıkarım ile YOLO26, CPU/NPU verimliliğinin kritik olduğu NVIDIA Jetson, Raspberry Pi veya cep telefonları gibi cihazlar için mükemmeldir.
- Küçük Nesne Algılama: STAL sayesinde YOLO26, drone görüntüleri veya üretimde kusur algılama gibi, hedeflerin görüntü boyutuna göre genellikle çok küçük olduğu senaryolarda üstün performans gösterir.
- Gerçek Zamanlı Video Analizi: Hız iyileştirmeleri, trafik izleme veya spor analizi için temel olan daha yüksek kare hızlarını işlemeye olanak tanır.
YOLOv5 Ne Zaman Tercih Edilmeli?
Daha eski olmasına rağmen, YOLOv5 hala bir nişe sahiptir:
- Eski Sistemler: 2020 dönemi YOLOv5 depo yapısı etrafında sıkı bir şekilde inşa edilmiş mevcut işlem hatları, eski modeli sürdürmeyi, geçiş yapmaktan daha kolay bulabilir.
- En Geniş Donanım Desteği: Daha eski olması nedeniyle YOLOv5, henüz yeni mimariler için optimize edilmiş desteğe sahip olmayabilecek çok belirsiz mikrodenetleyiciler de dahil olmak üzere, akla gelebilecek hemen her platforma taşınmıştır.
Sonuç
YOLOv5 erişilebilirliği ve güvenilirliği ile modern nesne algılamanın temelini atmış olsa da, YOLO26 önemli bir ileri adımı temsil etmektedir. Uçtan uca NMS'siz bir tasarımı benimseyerek, uç donanım için optimize ederek ve MuSGD ve ProgLoss gibi gelişmiş eğitim tekniklerini dahil ederek, YOLO26 en iyi performansı arayan geliştiriciler için cazip bir yükseltme sunar.
Çoğu kullanıcı için seçim açıktır: YOLO26, günümüzün zorlu bilgisayar görüşü uygulamaları için gereken hızı, doğruluğu ve çok yönlülüğü sağlar.
Diğer Modelleri İnceleyin
Diğer mimarileri keşfetmekle ilgileniyorsanız, YOLO26'nın doğrudan öncülü olan YOLO11'e veya açık-kelime algılama yetenekleri için YOLO-World'e göz atın.