YOLO26 ve YOLOv10: Uçtan Uca Nesne Algılama Modellerinin Karşılaştırılması

Bilgisayarlı görü dünyası, daha hızlı, daha doğru ve daha verimli modellere olan taleple sürekli gelişmektedir. Bu kılavuz, gerçek zamanlı nesne algılama alanındaki iki çığır açıcı mimari olan YOLO26 ve YOLOv10 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. Mimarilerini, performans metriklerini ve dağıtım yeteneklerini analiz ederek, geliştiricilerin ve araştırmacıların vizyon uygulamaları için en uygun modeli seçmelerine yardımcı olmayı amaçlıyoruz.

NMS-Free Mimarilerin Evrimi

Yıllardır YOLO (You Only Look Once) ailesi, işlem sonrası aşamada gereksiz sınırlayıcı kutuları filtrelemek için büyük ölçüde Non-Maximum Suppression (NMS) yöntemine güveniyordu. Etkili olmasına rağmen NMS, çıkarım gecikmesine neden olur ve Raspberry Pi veya özelleşmiş sinirsel işlem birimleri (NPU'lar) gibi uç cihazlarda dağıtımı zorlaştırır.

YOLOv10'un tanıtılması, uçtan uca NMS-free (NMS'siz) tasarımıyla öncülük ederek bir paradigma değişimi temsil etti. Bu temel atılımdan yola çıkan Ultralytics YOLO26, mimariyi üretim ortamları için geliştirerek, çok çeşitli görevlerde eşi benzeri görülmemiş bir verimlilik ve kullanım kolaylığı sağladı.

İşlem Sonrası Darboğazı

NMS'i kaldırmak, TensorRT ve OpenVINO gibi donanım hızlandırıcılarında bilgisayarlı görü modellerinin optimizasyonunu geleneksel olarak engelleyen dinamik ve veriye bağımlı işlem sonrası adımını ortadan kaldırır.

YOLOv10: NMS-Free Algılamada Öncü

Tarih: 2024-05-23
Yazarlar: Ao Wang, Hui Chen, Lihao Liu ve diğerleri.
Kuruluş: Tsinghua Üniversitesi
Kaynaklar: ArXiv Makalesi | GitHub Deposu

Tsinghua Üniversitesi'ndeki araştırmacılar tarafından geliştirilen YOLOv10, NMS ihtiyacını ortadan kaldırmak için tutarlı bir ikili atama stratejisi getirdi. Bütünsel bir verimlilik-doğruluk odaklı model tasarımı kullanarak, güçlü mAP (mean Average Precision) değerlerini korurken hesaplama fazlalığını azalttı.

Güçlü Yönler:

  • NMS-Free Mimari: YOLO serisinde NMS-free tasarımın orijinal öncüsüdür ve gerçek zamanlı uygulamalar için gecikmeyi önemli ölçüde azaltır.
  • Verimlilik: Önceki nesil modellere kıyasla parametre sayısı ve çıkarım hızı arasında güçlü bir denge sunar.

Zayıf Yönler:

  • Sınırlı Görev Desteği: Birincil olarak standart nesne algılamaya odaklanmıştır; segmentasyon veya poz tahmini gibi gelişmiş görevler için yerel, kutudan çıktığı gibi bir desteği yoktur.
  • Akademik Odak: Kod tabanı sağlam olmakla birlikte, basitleştirilmiş ve kurumsal düzeyde üretim dağıtımından ziyade araştırmaya daha yakındır.

YOLOv10 hakkında daha fazla bilgi edinin

YOLO26: Uç ve Bulut için Yeni Standart

Tarih: 2026-01-14
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Kaynaklar: GitHub Deposu | Ultralytics Platform

YOLO11 sürümünün halefi olarak piyasaya sürülen YOLO26, NMS-free kavramını nihai gerçekliğine taşır. Uçtan uca algılamayı, modern makine öğrenimi hattı için eksiksiz bir araç takımı sağlayan, yüksek düzeyde optimize edilmiş Ultralytics Platform ile yerel olarak bütünleştirir.

YOLO26, birkaç mimari atılımı beraberinde getiriyor:

  • DFL Kaldırma: Distribution Focal Loss tamamen kaldırıldı. Bu, model dışa aktarma sürecini önemli ölçüde basitleştirir ve uç cihazlar ve düşük güç tüketen cihazlarla uyumluluğu artırır.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: DFL'nin kaldırılması ve yapısal optimizasyonlar sayesinde YOLO26, CPU'larda önemli ölçüde daha hızlıdır, bu da onu IoT ve mobil dağıtımlar için ideal hale getirir.
  • MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitim tekniklerinden (Moonshot AI'ın Kimi K2'si gibi) esinlenen YOLO26, SGD ve Muon'un bir melezini kullanır. Bu, bilgisayarlı görüye benzersiz bir eğitim kararlılığı ve daha hızlı yakınsama getirir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntüleri ve drone tabanlı güvenlik izleme için kritik olan küçük nesne tanımada kayda değer iyileştirmeler sağlar.
  • Göreve Özel İyileştirmeler: YOLO26 sadece bir algılayıcı değildir. Segmentasyon için Anlamsal Segmentasyon kaybı ve çok ölçekli proto, Poz Tahmini için Residual Log-Likelihood Estimation (RLE) ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) için özel açı kaybı özelliklerine sahiptir.

YOLO26 hakkında daha fazla bilgi edin

Performans Analizi ve Metrikleri

Aşağıdaki tablo, YOLO26 ve YOLOv10 modellerinin COCO algılama performansını karşılaştırmaktadır. YOLO26'nın olağanüstü parametre verimliliğini korurken nasıl daha üstün bir doğruluk elde ettiğine dikkat edin.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics Avantajı: Eğitim ve Bellek Verimliliği

Modelleri üretime alırken, bellek gereksinimleri ve eğitim verimliliği, çıkarım hızı kadar önemlidir. Ultralytics modelleri, özellikle YOLO26, eğitim sırasında CUDA bellek kullanımını azaltmak için yüksek düzeyde optimize edilmiştir. Bu, geliştiricilerin tüketici sınıfı GPU'larda daha büyük batch sizes kullanmalarına olanak tanıyarak eğitim süresini ve hesaplama maliyetlerini önemli ölçüde azaltır. Buna karşılık, RT-DETR gibi karmaşık mimariler veya ağır transformer modelleri genellikle etkili bir şekilde eğitilmek için pahalı, üst düzey donanımlar gerektirir.

Sürekli Entegrasyon ve Ekosistem

YOLO26'yı seçmenin en büyük faydalarından biri, bakımı iyi yapılan Ultralytics ekosistemiyle olan entegrasyonudur. Veri etiketlemeden deney takibine kadar platform, bir makine öğrenimi mühendisinin ihtiyaç duyduğu her şeyi tek bir çatı altında sunar.

Pratik Uygulama: Kod Örneği

Ultralytics'in ayırt edici özelliği, sektör lideri Kullanım Kolaylığı'dır. Sezgisel bir Python API ile, YOLOv8 gibi eski bir modelden en son teknoloji YOLO26'ya geçmek, kodun sadece tek bir satırını güncellemeyi gerektirir.

İşte YOLO26 kullanarak nasıl eğitim ve çıkarım yapılacağını gösteren %100 çalıştırılabilir bir örnek:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Kullanım Durumları ve Öneriler

YOLO26 ile YOLOv10 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman YOLO26 Seçilmeli

YOLO26 aşağıdakiler için güçlü bir seçimdir:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ne Zaman YOLOv10 Seçilmeli

YOLOv10 aşağıdakiler için önerilir:

  • NMS-Free Gerçek Zamanlı Algılama: Non-Maximum Suppression olmadan uçtan uca algılamadan faydalanan, dağıtım karmaşıklığını azaltan uygulamalar.
  • Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile algılama doğruluğu arasında güçlü bir denge gerektiren projeler.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

Sonuç

YOLOv10, NMS-free paradigmasını tanıtarak akademik topluluğa önemli katkılarda bulunmuş olsa da, YOLO26 bu teknolojiyi kurumsal düzeyde hazır hale getirir. CPU hızındaki %43'lük dikkat çekici artışı, yenilikçi MuSGD iyileştiricisi ve görme görevlerindeki benzersiz çok yönlülüğü ile YOLO26, hem uç bilişim hem de büyük ölçekli bulut dağıtımları için nihai seçenek olarak öne çıkıyor.

Aktif bir topluluğa, kapsamlı belgelere ve sorunsuz bir geliştirici deneyimine öncelik veren ekipler için Ultralytics ekosistemi benzersizdir. Özelleşmiş senaryolar için modeller araştırıyorsan, sıfır-atış (zero-shot) açık kelime dağarcıklı algılama için YOLO-World modelini de incelemek isteyebilirsin. Ancak, gerçek dünyadaki kullanım durumlarının büyük çoğunluğu için YOLO26 kesin öneridir.

Yorumlar