İçeriğe geç

YOLOv9 ve YOLO26: Mimari ve Performansın Karşılaştırmalı Analizi

Gerçek zamanlı nesne algılama alanı, her yeni yinelemede doğruluk, hız ve verimlilikte önemli iyileştirmelerle sürekli gelişmektedir. Bu makale, 2024'ün başlarında piyasaya sürülen güçlü bir model olan YOLOv9 ile Ultralytics'in yeni nesil uç yapay zeka uygulamaları için tasarladığı en son teknoloji modeli olan YOLO26 arasında derinlemesine bir teknik karşılaştırma sunmaktadır.

Modele Genel Bakış

Her iki model de bilgisayar görüşünde önemli kilometre taşlarını temsil etmekle birlikte, algılama sorununa biraz farklı mimari felsefelerle yaklaşmaktadırlar.

YOLOv9: Programlanabilir Gradyan Bilgisi

Tayvan'daki Academia Sinica araştırmacıları tarafından Şubat 2024'te piyasaya sürülen YOLOv9, derin sinir ağlarındaki bilgi kaybını ele almak için yeni kavramlar tanıttı.

  • Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
  • Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
  • Tarih: 21 Şubat 2024
  • Temel Yenilik: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).
  • Odak Noktası: Derin katmanlarda bilgi tutulmasını en üst düzeye çıkarmak için eğitim sırasında parametre kullanımını ve gradyan akışını iyileştirmek.

YOLOv9 hakkında daha fazla bilgi edinin.

YOLO26: Uç-Yerel Evrim

Ultralytics tarafından Ocak 2026'da piyasaya sürülen YOLO26, özellikle CPU ve kenar cihazlar için uçtan uca verimliliğe ve kolaylaştırılmış dağıtıma yönelik bir paradigma değişimini temsil etmektedir.

  • Yazarlar: Glenn Jocher, Jing Qiu
  • Kuruluş:Ultralytics
  • Tarih: 14 Ocak 2026
  • Temel Yenilik: Uçtan uca NMS içermeyen mimari, MuSGD Optimizatörü ve Dağıtım Odaklı Kaybın (DFL) kaldırılması.
  • Odak Noktası: GPU olmayan donanımlarda çıkarım gecikmesini en aza indirme, dışa aktarma süreçlerini basitleştirme ve Büyük Dil Modellerinden (LLM'ler) ilham alan teknikler kullanarak eğitim dinamiklerini stabilize etme.

YOLO26 hakkında daha fazla bilgi edinin

Mimari Farklılıklar

Bu iki model arasındaki temel farklılık, dağıtım hızlarını ve eğitim kararlılıklarını doğrudan etkileyen baş tasarımları ve kayıp formülasyonlarında yatmaktadır.

YOLOv9 Mimarisi

YOLOv9, Genelleştirilmiş Verimli Katman Agregasyon Ağı (GELAN) kullanır. Bu mimari, hızı feda etmeden çeşitli hesaplama bloklarının (CSPNet veya ELAN gibi) esnek entegrasyonuna olanak tanır. Programlanabilir Gradyan Bilgisi (PGI)'nin tanıtılması, yardımcı bir denetim çerçevesi sağlar. PGI, hafif modellerde sıkça görülen bir sorun olan, derin katmanlar boyunca yayılırken kritik özellik bilgisinin kaybolmamasını sağlar. Doğruluk için oldukça etkili olsa da, bu yapı geleneksel çapa tabanlı mekanizmalara ve Non-Maximum Suppression (NMS) gibi son işlem adımlarına dayanır.

YOLO26 Mimarisi

YOLO26, yerel olarak uçtan uca NMS içermeyen bir tasarım benimser. Karmaşık son işlem gerektirmeden nesneleri doğrudan tahmin ederek, YOLO26 özellikle NMS'nin hesaplama darboğazı olabileceği kenar cihazlarda gecikmeyi önemli ölçüde azaltır.

YOLO26'daki temel mimari değişiklikler şunları içerir:

  • DFL Kaldırılması: Dağıtım Odaklı Kayıp, model grafiğini basitleştirmek amacıyla kaldırıldı ve bu sayede dışa aktarma formatları ONNX ve TensorRT gibi düşük güçlü çiplerde daha temiz ve hızlı hale geldi.
  • ProgLoss + STAL: Yeni kayıp fonksiyonları, hava görüntüleri analizi ve robotik gibi görevler için kritik bir gereksinim olan küçük nesne tanımayı iyileştirir.
  • MuSGD Optimizatörü: SGD ve Muon'un (LLM eğitiminden esinlenilmiştir) bir hibriti olup, eğitim sırasında daha hızlı yakınsama ve azaltılmış bellek ani yükselişleri sunar.

Neden NMS'siz Olması Önemli

Geleneksel nesne dedektörleri, aynı nesne için birden fazla sınırlayıcı kutu tahmin eder ve bunları filtrelemek için Non-Maximum Suppression (NMS) kullanır. Bu adım genellikle sıralı ve CPU'larda yavaştır. YOLO26'nın uçtan uca tasarımı bu adımı tamamen ortadan kaldırarak %43'e kadar daha hızlı CPU çıkarımı sağlar.

Performans Karşılaştırması

Bu modelleri değerlendirirken, araştırmacılar genellikle çıkarım hızıyla birlikte COCO veri kümesindeki Ortalama Hassasiyeti (mAP) inceler.

Kıyaslama Metrikleri

Aşağıdaki tablo, performans ödünleşimlerini vurgulamaktadır. YOLOv9 güçlü doğruluk sunarken, YOLO26 özellikle CPU donanımında üstün hız-doğruluk oranları elde eder.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Analiz

  • Hız: YOLO26, çıkarım hızında açık bir avantaj sergiler. Örneğin, YOLO26n, seleflerinden önemli ölçüde daha hızlıdır ve bu da onu yüksek FPS video işleme için ideal kılar.
  • Doğruluk: YOLO26, mAP'te eşdeğer YOLOv9 modellerini geride bırakır; özellikle üretimde en yaygın kullanılan nano (n) ve küçük (s) varyantlarında.
  • Hesaplama: YOLO26, daha yüksek doğruluk için sürekli olarak daha az FLOP (Kayan Nokta İşlemi) gerektirir, bu da daha verimli bir mimari tasarımı gösterir.

Eğitim ve Kullanılabilirlik

Geliştiriciler için eğitim ve dağıtım kolaylığı, ham metrikler kadar önemlidir.

Ekosistem ve Destek

YOLO26 dahil Ultralytics modelleri, sağlam ve iyi bakımlı bir ekosistemden faydalanır. ultralytics Python paketi, için birleşik bir API sağlar. eğitim, doğrulamave dağıtım.

YOLOv9, güçlü olmasına rağmen, öncelikli olarak bir araştırma deposudur. Onu üretim hatlarına entegre etmek, Ultralytics çerçevesinin "pip install ve çalıştır" deneyimine kıyasla genellikle daha fazla manuel yapılandırma gerektirir.

Eğitim Verimliliği

YOLO26'nın MuSGD Optimizatörü, eğitimi stabilize etmeye yardımcı olarak kapsamlı hiperparametre ayarlama ihtiyacını azaltır. Ayrıca, Ultralytics modelleri, transformatör tabanlı alternatiflere kıyasla eğitim sırasında daha düşük bellek tüketimiyle bilinir, bu da kullanıcıların tüketici sınıfı GPU'larda daha büyük toplu iş boyutları eğitmesine olanak tanır.

Ultralytics API'sini kullanarak bir YOLO26 modelinin ne kadar kolay eğitilebileceğine dair bir örnek aşağıdadır:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

İdeal Kullanım Senaryoları

Bu modeller arasında seçim yapmak, sizin özel kısıtlamalarınıza bağlıdır.

YOLOv9 Ne Zaman Tercih Edilmeli?

  • Araştırma ve Akademik Çalışma: Çalışmanız gradyan akışını incelemek veya YOLOv9 belirli karşılaştırma ölçütlerini yeniden üretmekle ilgiliyse.
  • Özel Eski Boru Hatları: GELAN mimarisi için özel olarak ayarlanmış mevcut bir boru hattınız varsa ve model yapılarını kolayca değiştiremiyorsanız.

YOLO26 Ne Zaman Seçilmeli

  • Uç Bilişim: Yüzde 43'e kadar daha hızlı CPU çıkarımı ile YOLO26, Raspberry Pi, Jetson Nano ve mobil dağıtımlar için üstün bir seçimdir.
  • Gerçek Zamanlı Uygulamalar: NMS içermeyen tasarım, otonom sürüş ve güvenlik izleme sistemleri için kritik olan tutarlı gecikme süresi sağlar.
  • Karmaşık Görevler: YOLO26, detect'in ötesinde Örnek Segmentasyon, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) detect'i dahil olmak üzere çeşitli görevler için yerel destek sunar.
  • Kurumsal Üretim: Ultralytics ekosistemi tarafından sağlanan kararlılık, destek ve kolay dışa aktarım, YOLO26'yı ticari ürünler için daha güvenli bir seçenek haline getirir.

Detect Ötesinde

Standart YOLOv9 deposunun aksine, YOLO26 kutudan çıktığı gibi göreve özel iyileştirmelerle gelir. Bu iyileştirmeler arasında daha iyi maske doğruluğu için Semantik segmentasyon kaybı ve daha hassas poz tahmini anahtar noktaları için Kalıntı Log-Olasılık Tahmini (RLE) bulunmaktadır.

Sonuç

YOLOv9, programlanabilir gradyanlar ve bilgi saklama konularında büyüleyici konseptler sunarken, YOLO26, bu fikirlerin üretime hazır bir güç merkezine pratik evrimini temsil eder. Uçtan uca NMS içermeyen mimarisi, kapsamlı Ultralytics yazılım ekosistemiyle birleştiğinde, 2026 yılında hız, doğruluk ve kullanım kolaylığını dengelemek isteyen geliştiriciler için önerilen seçenek haline getirir.

Diğer modern mimarileri keşfetmek isteyenler için, belgeler ayrıca genel amaçlı bilgisayar görüşü görevleri için oldukça yetenekli bir model olmaya devam eden YOLO11'i de kapsar.


Yorumlar