YOLO26 ile YOLOv5: Nesne Tespitinde Nesiller Arası Bir Sıçrama

Bilgisayarlı görüdeki evrim; hız, doğruluk ve erişilebilirlik arayışıyla tanımlanmıştır. Doğru mimariyi seçmek, herhangi bir yapay zeka projesinin başarısı için kritiktir. Bu kapsamlı rehberde, Ultralytics'in iki devasa sürümünü karşılaştırıyoruz: öncü YOLOv5 ve çığır açan YOLO26. Her ikisi de gerçek zamanlı nesne tespiti dünyasını yoğun bir şekilde etkilemiş olsa da, temel teknolojileri sinir ağlarının görsel veriyi işleme biçiminde büyük bir paradigma değişimini yansıtır.

Model Genel Bakışı

Mimari nüanslara dalmadan önce, her iki modelin de temel detaylarını belirleyelim.

YOLO26 Detayları:

YOLO26 hakkında daha fazla bilgi edin

YOLOv5 Detayları:

YOLOv5 hakkında daha fazla bilgi edin

Diğer Seçenekleri Keşfetme

Bu rehber YOLO26 ve YOLOv5'e odaklansa da, eski sistemleri taşıyan geliştiriciler YOLO11 veya YOLOv10'un öncü NMS-free (NMS'siz) mimarisini karşılaştırmakla da ilgilenebilirler. Her ikisi de belirli dağıtım ortamları için mükemmel basamaklar sunar.

Mimari Yenilikler

YOLOv5 ile YOLO26 arasındaki altı yıllık fark, derin öğrenme araştırmalarında büyük bir sıçramayı temsil eder. YOLOv5, görüntü modelleri için PyTorch kullanımını yaygınlaştırdı ve endüstri standardı haline gelen, yüksek düzeyde optimize edilmiş, çapa tabanlı bir tespit mekanizması sundu. Ancak, işlem sonrası süreçte Non-Maximum Suppression (NMS) yöntemine ağır bir şekilde bağımlıydı, bu da kaynakları kısıtlı cihazlarda gecikme darboğazlarına neden olabiliyordu.

YOLO26, çıkarım hattını Uçtan Uca NMS'siz Tasarım ile tamamen yeniden hayal ediyor. NMS işlem sonrası ihtiyacını ortadan kaldıran YOLO26, ilk olarak YOLOv10'da öncülük edilen ancak burada mükemmelleştirilen bir konseptle daha hızlı ve çok daha basit bir dağıtım mantığı sunuyor. Ayrıca YOLO26, çıktı katmanını ciddi şekilde basitleştiren DFL Removal (Dağılımsal Odak Kaybı Kaldırma) özelliğine sahiptir. Bu, modeli ONNX ve TensorRT gibi formatlara dışa aktarmayı inanılmaz derecede pürüzsüz hale getirerek, uç cihazlar ve düşük güç tüketen cihazlarla mükemmel uyumluluk sağlar.

Eğitim sırasında YOLO26, Moonshot AI'ın Kimi K2 modelinden esinlenen, SGD ve Muon'un bir melezi olan son teknoloji MuSGD Optimizer kullanır. Bu, büyük dil modeli eğitimindeki yenilikleri bilgisayarlı görü alanına taşıyarak, YOLOv5'te kullanılan geleneksel SGD veya AdamW iyileştiricilerine kıyasla son derece kararlı bir eğitim ve çok daha hızlı yakınsama garanti eder.

Performans ve Metrikler

Modelleri değerlendirirken, mean Average Precision (mAP) ile çıkarım hızı arasındaki denge gerçek dünya uygulanabilirliğini belirler. YOLO26, hem üst düzey GPU'lar hem de uç CPU'lar için yerel olarak optimize edilmiştir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Kıyaslamalar şaşırtıcı bir gelişmeyi ortaya koyuyor. Örneğin, YOLO26n modeli, YOLOv5n'in 28.0 mAP değerine kıyasla 40.9 mAP değerine ulaşırken, aynı zamanda %43'e kadar daha hızlı CPU çıkarımı sunuyor. Bu, YOLO26'yı Raspberry Pi gibi gömülü sistemler veya mobil cihazlar için çok daha üstün kılar. YOLOv5, Nano ölçeğinde TensorRT GPU hızında hafif bir avantaja sahip olsa da, doğruluk takası YOLO26 lehinedir.

Eğitim Ekosistemi ve Kullanım Kolaylığı

Her iki model de, iyi korunmuş Ultralytics ekosisteminden büyük ölçüde yararlanır. Modern bir Python API, kapsamlı dokümantasyon ve aktif topluluk desteği ile "sıfırdan kahramana" bir deneyim sunarlar. Ancak YOLO26, eğitim verimliliğini yeni bir seviyeye taşıyor.

Ultralytics modelleri, eğitim sırasında Transformer tabanlı alternatiflerden sürekli olarak çok daha düşük CUDA memory tüketir. YOLO26 bunu ProgLoss + STAL kayıp fonksiyonlarıyla güçlendirir. Bu ilerlemeler, bellek yükünü artırmadan küçük nesne tanımada belirgin iyileştirmeler sağlar.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Bu basit betik, geliştiricilerin özel veri kümeleri üzerinde hızlı bir şekilde yineleme yapmalarına, veri alımından üretime hazır bir modele sorunsuz bir şekilde geçmelerine olanak tanır.

Kolaylaştırılmış Dağıtım

Ultralytics Platform kullanarak, eğitilmiş YOLO26 modellerini tek bir satır dönüştürme kodu bile yazmadan CoreML veya TensorFlow Lite gibi formatlara otomatik olarak aktarabilirsin.

Çok Yönlülük ve İdeal Kullanım Durumları

YOLOv5 Ne Zaman Kullanılmalı?

YOLOv5, eski sistemler için güvenilir bir iş atı olmaya devam ediyor. Çapa tabanlı çıktılara yoğun şekilde bağlı mevcut bir endüstriyel hattın varsa veya olgun, dondurulmuş TensorRT yığınlarıyla eski NVIDIA Jetson cihazlarında çıkarım yapıyorsan, YOLOv5 kararlı ve çok iyi belgelenmiş bir çözüm sunar.

YOLO26 Ne Zaman Kullanılmalı?

YOLO26, modern bilgisayarlı görü projeleri için kesin tercihtir. Çok yönlülüğü, selefini fazlasıyla geride bırakır. YOLOv5 temel olarak tespit (daha sonra eklenen segmentasyon özellikleriyle) üzerine odaklansa da, YOLO26; Örnek Segmentasyonu, Poz Tahmini, Görüntü Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) için derin ve yerel destek sunar.

YOLO26; özelleşmiş bir anlamsal segmentasyon kaybı, ultra hassas poz anahtar noktaları için Residual Log-Likelihood Estimation (RLE) ve zorlu sınır problemlerini çözmek için gelişmiş açı kaybı gibi Göreve Özel İyileştirmeler getirir.

  • Uç IoT ve Robotik: NMS'siz mimari ve %43 daha hızlı CPU çıkarımı, YOLO26'yı gerçek zamanlı robotik navigasyon ve akıllı ev kameraları için ideal kılar.
  • Hava Görüntüleme: ProgLoss + STAL geliştirmeleri, otoparklardaki araçlar veya tarım alanlarındaki mahsuller gibi dronlardan alınan minik nesnelerin tespitini önemli ölçüde daha güvenilir hale getirir.
  • Gerçek Zamanlı Video Analitiği: İster spor yayınlarında sporcuları takip et, ister trafik akışlarını izle; YOLO26'nın performans dengesi, kare kaybı yaşamadan yüksek hatırlama oranını garanti eder.

Sonuç olarak, Ultralytics'in erişilebilir, yüksek performanslı bir ekosisteme olan bağlılığı, YOLOv5'ten YOLO26'ya geçişin sorunsuz olmasını sağlar ve hem araştırmacılar hem de geliştiriciler için en güncel yeteneklerin kilidini açar.

Yorumlar