İçeriğe geç

YOLO26 vs YOLOv10: Uçtan Uca Nesne Algılama Modellerinin Karşılaştırması

Bilgisayar görüşü alanı, daha hızlı, daha doğru ve daha verimli modellere olan taleple sürekli gelişmektedir. Bu kılavuz, gerçek zamanlı nesne algılama alanındaki iki çığır açan mimari olan YOLO26 ve YOLOv10 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. Mimarlarını, performans metriklerini ve dağıtım yeteneklerini analiz ederek, geliştiricilerin ve araştırmacıların kendi görüş uygulamaları için en uygun modeli seçmelerine yardımcı olmayı amaçlıyoruz.

NMS'siz Mimarilerin Evrimi

Yıllardır, YOLO (You Only Look Once) ailesi, işlem sonrası aşamasında gereksiz sınırlayıcı kutuları filtrelemek için büyük ölçüde Non-Maximum Suppression (NMS) yöntemine güvenmiştir. Etkili olmasına rağmen, NMS çıkarım gecikmesi yaratır ve Raspberry Pi veya özel sinirsel işlem birimleri (NPU'lar) gibi uç cihazlarda dağıtımı karmaşıklaştırır.

YOLOv10'un tanıtımı, uçtan uca NMS'siz bir tasarımın öncülüğünü yaparak bir paradigma değişimi temsil etti. Bu temel çığır açıcı gelişimin üzerine inşa edilen Ultralytics YOLO26, mimariyi üretim ortamları için iyileştirerek, daha geniş bir görev yelpazesinde eşi benzeri görülmemiş bir verimlilik ve kullanım kolaylığı sağladı.

İşlem Sonrası Darboğazı

NMS'nin kaldırılması, geleneksel olarak TensorRT ve OpenVINO gibi donanım hızlandırıcılarda bilgisayar görüşü modellerinin optimizasyonunu engelleyen dinamik, veriye bağımlı işlem sonrası adımını ortadan kaldırır.

YOLOv10: NMS'siz Algılamada Öncü

Tarih: 2024-05-23
Yazarlar: Ao Wang, Hui Chen, Lihao Liu, vd.
Kuruluş:Tsinghua University
Kaynaklar:ArXiv Makalesi | GitHub Deposu

Tsinghua Üniversitesi araştırmacıları tarafından geliştirilen YOLOv10, NMS ihtiyacını ortadan kaldırmak için tutarlı bir ikili atama stratejisi sundu. Bütünsel bir verimlilik-doğruluk odaklı model tasarımı kullanarak, güçlü bir mAP (ortalama Ortalama Hassasiyet) korurken hesaplama fazlalığını azalttı.

Güçlü Yönler:

  • NMS'siz Mimari: YOLO serisinde NMS'siz tasarımın orijinal öncüsü olup, gerçek zamanlı uygulamalar için gecikmeyi önemli ölçüde azaltır.
  • Verimlilik: Önceki nesil modellere kıyasla parametre sayısı ve çıkarım hızı arasında güçlü bir denge sunar.

Zayıflıklar:

  • Sınırlı Görev Desteği: Öncelikli olarak standart nesne algılamaya odaklanmış olup, segmentasyon veya poz tahmini gibi gelişmiş görevler için yerel, kutudan çıktığı gibi desteği yoktur.
  • Akademik Odak: Kod tabanı sağlam olmasına rağmen, kolaylaştırılmış, kurumsal düzeyde üretim dağıtımından ziyade araştırmaya daha yatkındır.

YOLOv10 hakkında daha fazla bilgi edinin.

YOLO26: Uç ve Bulut için Yeni Standart

Tarih: 2026-01-14
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Kaynaklar:GitHub Deposu | Ultralytics Platformu

YOLO11'in halefi olarak piyasaya sürülen YOLO26, NMS'siz konsepti nihai gerçekleşmesine taşır. Uçtan uca algılamayı yüksek düzeyde optimize edilmiş Ultralytics Platformu'na yerel olarak entegre ederek, modern makine öğrenimi hattı için eksiksiz bir araç paketi sunar.

YOLO26 birkaç mimari çığır açıcı yenilik sunar:

  • DFL Kaldırma: Distribution Focal Loss tamamen kaldırılmıştır. Bu, model dışa aktarma sürecini önemli ölçüde basitleştirir ve uç ile düşük güç tüketimli cihazlarla uyumluluğu artırır.
  • Yüzde 43'e Kadar Daha Hızlı CPU Çıkarımı: DFL'nin kaldırılması ve yapısal optimizasyonlar sayesinde, YOLO26 CPU'larda önemli ölçüde daha hızlıdır, bu da onu IoT ve mobil dağıtımlar için ideal kılar.
  • MuSGD Optimize Edici: Büyük Dil Modeli (LLM) eğitim tekniklerinden (Moonshot AI'nin Kimi K2'si gibi) esinlenerek, YOLO26, SGD ve Muon'un bir hibritini kullanır. Bu, bilgisayar görüşüne eşsiz eğitim kararlılığı ve daha hızlı yakınsama getirir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada önemli iyileşmeler sağlar; bu da hava görüntüleri ve drone tabanlı güvenlik izleme için kritik öneme sahiptir.
  • Göreve Özel İyileştirmeler: YOLO26 sadece bir algılayıcı değildir. Segmentasyon için Semantik Segmentasyon kaybı ve çok ölçekli proto, Poz Tahmini için Residual Log-Likelihood Estimation (RLE) ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) için özel açı kaybı özelliklerine sahiptir.

YOLO26 hakkında daha fazla bilgi edinin

Performans Analizi ve Metrikler

Aşağıdaki tablo, YOLO26 ve YOLOv10 modellerinin COCO detect performansını karşılaştırmaktadır. YOLO26'nın olağanüstü parametre verimliliğini korurken üstün doğruluk elde ettiğine dikkat edin.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics Avantajı: Eğitim ve Bellek Verimliliği

Modelleri üretime dağıtırken, bellek gereksinimleri ve eğitim verimliliği, çıkarım hızı kadar kritik öneme sahiptir. Ultralytics modelleri, özellikle YOLO26, eğitim sırasında CUDA bellek kullanımını azaltmak için yüksek düzeyde optimize edilmiştir. Bu, geliştiricilerin tüketici sınıfı GPU'larda daha büyük toplu iş boyutları kullanmasına olanak tanıyarak eğitim süresini ve hesaplama maliyetlerini önemli ölçüde azaltır. Tersine, karmaşık mimariler veya RT-DETR gibi ağır transformatör modelleri, etkili bir şekilde eğitmek için genellikle pahalı, üst düzey donanım gerektirir.

Sürekli Entegrasyon ve Ekosistem

YOLO26'yı seçmenin en büyük faydalarından biri, iyi yönetilen Ultralytics ekosistemiyle entegrasyonudur. Veri etiketlemeden deney takibine kadar, platform bir makine öğrenimi mühendisinin ihtiyaç duyduğu her şeyi tek bir çatı altında sunar.

Pratik Uygulama: Kod Örneği

Ultralytics'in alametifarikası, sektör lideri Kullanım Kolaylığıdır. Sezgisel bir python API'si ile, YOLOv8 gibi eski bir modelden son teknoloji YOLO26'ya geçiş, yalnızca tek bir kod satırını güncellemeyi gerektirir.

YOLO26 kullanarak nasıl eğitim ve çıkarım yapılacağını gösteren %100 çalıştırılabilir bir örnek aşağıdadır:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Kullanım Durumları ve Öneriler

YOLO26 ve YOLOv10 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

YOLO26 Ne Zaman Seçilmeli

YOLO26 şunlar için güçlü bir seçenektir:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

YOLOv10 Ne Zaman Tercih Edilmeli?

YOLOv10 şunlar için önerilir:

  • NMS-Serbest Gerçek Zamanlı Algılama: Non-Maximum Suppression olmadan uçtan uca algılamadan faydalanan, dağıtım karmaşıklığını azaltan uygulamalar.
  • Dengeli Hız-Doğruluk Dengelemeleri: Çeşitli model ölçeklerinde çıkarım hızı ve algılama doğruluğu arasında güçlü bir denge gerektiren projeler.
  • Tutarlı Gecikme Süreli Uygulamalar: Tahmin edilebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları, örneğin robotik veya otonom sistemler.

Sonuç

YOLOv10, NMS içermeyen paradigmayı tanıtarak akademik topluluğa önemli katkılar sağlarken, YOLO26 bu teknolojiyi kurumsal düzeyde hazır hale getiriyor. %43'lük dikkat çekici CPU hızı artışı, yenilikçi MuSGD optimize edicisi ve görme görevlerinde eşsiz çok yönlülüğü ile YOLO26, hem uç bilişim hem de büyük ölçekli bulut dağıtımları için nihai seçenek olarak öne çıkıyor.

Aktif bir topluluğu, kapsamlı dokümantasyonu ve sorunsuz bir geliştirici deneyimini önceliklendiren ekipler için Ultralytics ekosistemi eşsizdir. Özel senaryolar için modeller araştırıyorsanız, sıfır atışlı açık kelime algılama için YOLO-World'ü de incelemek isteyebilirsiniz. Ancak, gerçek dünya kullanım durumlarının büyük çoğunluğu için YOLO26 kesin bir öneridir.


Yorumlar