YOLO26 ve YOLOv5: Nesne Algılamada Nesilsel Bir Sıçrama
Bilgisayar görüşünün evrimi, hız, doğruluk ve erişilebilirliğin amansız takibiyle tanımlanmıştır. Doğru mimariyi seçmek, herhangi bir yapay zeka projesinin başarısı için kritik öneme sahiptir. Bu kapsamlı kılavuzda, Ultralytics'ten iki anıtsal sürümü karşılaştırıyoruz: öncü YOLOv5 ve çığır açan YOLO26. Her ikisi de gerçek zamanlı nesne algılama alanını büyük ölçüde etkilemiş olsa da, temel teknolojileri sinir ağlarının görsel verileri işleme biçiminde büyük bir paradigma değişimini yansıtmaktadır.
Modele Genel Bakış
Mimari nüanslara dalmadan önce, her iki modelin temel detaylarını belirleyelim.
YOLO26 Detayları:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- Belgeler: YOLO26 Dokümantasyonu
YOLO26 hakkında daha fazla bilgi edinin
YOLOv5 Detayları:
- Yazarlar: Glenn Jocher
- Organizasyon: Ultralytics
- Tarih: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Belgeler: YOLOv5 Belgeleri
YOLOv5 hakkında daha fazla bilgi edinin.
Diğer Seçenekleri Keşfetme
Bu kılavuz YOLO26 ve YOLOv5'e odaklansa da, eski sistemleri taşıyan geliştiriciler YOLO11 veya YOLOv10'un öncü NMS içermeyen mimarisini karşılaştırmakla da ilgilenebilirler. Her ikisi de belirli dağıtım ortamları için mükemmel basamaklar sunar.
Mimari Yenilikler
YOLOv5 ve YOLO26 arasındaki altı yıllık fark, derin öğrenme araştırmalarında büyük bir sıçramayı temsil ediyor. YOLOv5, görme modelleri için PyTorch'un yaygın kullanımını popülerleştirdi ve endüstri standardı haline gelen yüksek düzeyde optimize edilmiş, çapa tabanlı bir detect mekanizması sundu. Ancak, işlem sonrası sırasında Non-Maximum Suppression (NMS)'a büyük ölçüde güveniyordu, bu da kaynak kısıtlı cihazlarda gecikme darboğazları oluşturabilirdi.
YOLO26, çıkarım hattını Uçtan Uca NMS İçermeyen Tasarım ile tamamen yeniden tasarlıyor. NMS işlem sonrası ihtiyacını ortadan kaldırarak, YOLO26 daha hızlı ve çok daha basit bir dağıtım mantığı sunar; bu, ilk olarak YOLOv10'da öncülük edilen ancak burada mükemmelleştirilen bir konsepttir. Ayrıca, YOLO26, çıktı başlığını önemli ölçüde basitleştiren DFL Kaldırma (Distribution Focal Loss) özelliğine sahiptir. Bu, modeli ONNX ve TensorRT gibi formatlara aktarmayı inanılmaz derecede sorunsuz hale getirerek, uç ve düşük güçlü cihazlarla mükemmel uyumluluk sağlar.
Eğitim sırasında YOLO26, Moonshot AI'nin Kimi K2'sinden esinlenen SGD ve Muon'un bir hibriti olan son teknoloji MuSGD Optimizer kullanır. Bu, LLM eğitim yeniliklerini bilgisayar görüşü alanına taşıyarak, YOLOv5'te kullanılan geleneksel SGD veya AdamW optimize edicilerine kıyasla oldukça kararlı eğitim ve önemli ölçüde daha hızlı yakınsama garanti eder.
Performans ve Metrikler
Modelleri değerlendirirken, ortalama Ortalama Hassasiyet (mAP) ve çıkarım hızı arasındaki denge, gerçek dünya uygulanabilirliğini belirler. YOLO26, hem üst düzey GPU'lar hem de uç CPU'lar için doğal olarak optimize edilmiştir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Kıyaslamalar şaşırtıcı bir gelişme ortaya koyuyor. Örneğin, YOLO26n 40.9 mAP elde ederken, YOLOv5n28.0'a kıyasla aynı anda sunar %43'e kadar daha hızlı CPU çıkarımı. Bu, YOLO26'yı gömülü dağıtımlar için çok daha üstün kılar, örneğin Raspberry Pi veya mobil cihazlar. YOLOv5, Nano ölçekte TensorRT GPU hızında hafif bir avantaja sahip olsa da, doğruluk dengesi büyük ölçüde YOLO26'yı desteklemektedir.
Eğitim Ekosistemi ve Kullanım Kolaylığı
Her iki model de iyi yönetilen Ultralytics ekosisteminden büyük ölçüde faydalanmaktadır. Akıcı bir Python API'si, kapsamlı dokümantasyon ve aktif topluluk desteği ile "sıfırdan zirveye" bir deneyim sunarlar. Ancak, YOLO26 eğitim verimliliğini yeni bir seviyeye taşır.
Ultralytics modelleri, eğitim sırasında transformatör ağırlıklı alternatiflere göre sürekli olarak önemli ölçüde daha düşük CUDA belleği talep eder. YOLO26, ProgLoss + STAL kayıp fonksiyonları ile bunu güçlendirir. Bu gelişmeler, bellek yükünü artırmadan küçük nesne tanımada dikkate değer iyileştirmeler sağlar.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
Bu basit betik, geliştiricilerin özel veri kümeleri üzerinde hızla yineleme yapmasına, veri alımından üretime hazır bir modele sorunsuz bir şekilde geçmesine olanak tanır.
Kolaylaştırılmış Dağıtım
Ultralytics Platformu'nu kullanarak, eğitilmiş YOLO26 modellerinizi tek bir dönüştürme kodu satırı yazmadan CoreML veya TensorFlow Lite gibi formatlara otomatik olarak aktarabilirsiniz.
Çok Yönlülük ve İdeal Kullanım Durumları
YOLOv5 Ne Zaman Kullanılmalı
YOLOv5, eski sistemler için güvenilir bir iş gücü olmaya devam etmektedir. Mevcut endüstriyel iş akışınız çapa tabanlı çıktılara yoğun bir şekilde bağlıysa veya olgunlaşmış, dondurulmuş TensorRT yığınlarına sahip eski NVIDIA Jetson cihazlarında çıkarım yapıyorsanız, YOLOv5 istikrarlı, iyi belgelenmiş bir çözüm sunar.
YOLO26 Ne Zaman Kullanılmalı
YOLO26, modern bilgisayar görüşü projeleri için kesin bir seçimdir. Çok yönlülüğü, selefini fersah fersah geride bırakır. YOLOv5 öncelikli olarak algılamaya (daha sonra segmentasyon eklemeleriyle) odaklanırken, YOLO26 Örnek Segmentasyonu, Duruş Tahmini, Görüntü Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) için derin, yerel destek sunar.
YOLO26, özel bir anlamsal segmentasyon kaybı, ultra hassas duruş anahtar noktaları için Kalıntı Log-Olasılık Tahmini (RLE) ve zorlu sınır sorunlarını çözmek için OBB için gelişmiş açı kaybı gibi Göreve Özgü İyileştirmeler sunar.
- Uç IoT ve Robotik: NMS içermeyen mimarisi ve %43 daha hızlı CPU çıkarımı, YOLO26'yı gerçek zamanlı robotik navigasyon ve akıllı ev kameraları için ideal kılar.
- Hava Görüntüleme: ProgLoss + STAL iyileştirmeleri, dronlardan küçük nesneleri (otoparklardaki araçlar veya tarım alanlarındaki ürünler gibi) algılamayı önemli ölçüde daha güvenilir hale getirir.
- Gerçek Zamanlı Video Analizi: İster spor yayınlarında sporcuları takip etme, ister trafik akışlarını izleme olsun, YOLO26'nın performans dengesi, kare düşürmeden yüksek geri çağırma sağlar.
Sonuç olarak, Ultralytics'in erişilebilir, yüksek performanslı bir ekosisteme olan bağlılığı, YOLOv5'ten YOLO26'ya geçişin sorunsuz olmasını sağlayarak hem araştırmacılar hem de geliştiriciler için son teknoloji yeteneklerin kilidini açar.