İçeriğe geç

YOLOv9 YOLO26: Gerçek Zamanlı Nesne Algılamanın Evrimi

Hızla gelişen bilgisayar görme alanında, doğru model mimarisini seçmek performans, verimlilik ve dağıtım kolaylığı arasında denge sağlamak için çok önemlidir. Bu karşılaştırma, YOLOv9ile Ultralytics Ocak 2026'da Ultralytics en son teknoloji ürünü YOLO26 arasındaki teknik farklılıkları incelemektedir. Her iki model de YOLO önemli kilometre taşları olsa da, hız, eğitim istikrarı ve dağıtım karmaşıklığı açısından farklı ihtiyaçları karşılamaktadır.

Model Genel Bakış ve Yazarlık

Bu mimarilerin kökenini anlamak, tasarım felsefelerinin bağlamını anlamamızı sağlar.

YOLOv9: Programlanabilir Gradyan Bilgisi

Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş:Bilgi Bilimleri Enstitüsü, Academia Sinica
Tarih: 2024-02-21
Bağlantılar:Arxiv Makalesi | GitHub Deposu

YOLOv9 , Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) kavramlarını YOLOv9 . Bu yenilikler, verilerin ardışık katmanlardan geçerken kaybolduğu derin sinir ağlarındaki "bilgi darboğazı" sorununu çözdü. PGI, kritik özellik bilgilerinin derin ağ boyunca korunmasını sağlayarak, özellikle karmaşık sahnelerde yüksek doğrulukta algılamalar yapılmasına olanak tanır.

YOLO26: Uçtan Uca Kenar Uzmanı

Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 2026-01-14
Bağlantılar:Resmi Belgeler | GitHub Deposu

YOLOv8'in mirasını temel alarak YOLOv8 ve YOLO11'nin mirasını temel alan YOLO26, basitleştirilmiş, yüksek hızlı dağıtım yönünde bir değişimi temsil ediyor. Doğal olarak uçtan uca NMS ve Non-Maximum Suppression son işlemine gerek kalmaz. Bu tasarım seçimi, Distribution Focal Loss (DFL) özelliğinin kaldırılmasıyla birleştiğinde, YOLO26'yı CPU uç cihazlarda olağanüstü hızlı hale getirir. Ayrıca, istikrarlı bir yakınsama sağlamak için SGD Muon'un (LLM eğitiminden esinlenerek) bir karışımı olan MuSGD optimizer'ın kullanımında öncü rol oynar.

YOLO26 hakkında daha fazla bilgi edinin

Performans ve Metrik Karşılaştırması

Aşağıdaki tablo, COCO veri setinde standart modellerin performansını karşılaştırmaktadır. YOLO26'nın mimari optimizasyonu sayesinde CPU önemli bir hız avantajı sağladığını unutmayın.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Performans Analizi

YOLO26, gecikme süresi ve hesaplama verimliliği açısından açık bir avantaj sunar. Örneğin, YOLO26n, YOLOv9t'den (38,3%) daha yüksek bir mAP 40,9%) elde ederken, önemli ölçüde daha az FLOP (5,4 milyar karşı 7,7 milyar) kullanır. Bu verimlilik, pille çalışan uç cihazlarda çalışan uygulamalar için çok önemlidir.

Mimari Derinlemesine İnceleme

YOLOv9 Mimarisi

YOLOv9 , bilgi akışını korumaya YOLOv9 . GELAN backbone, CSPNet (gradyan yol planlama) ve ELAN (çıkarım hızı) özelliklerinin güçlü yanlarını birleştirerek hafif ancak güçlü bir özellik çıkarıcı oluşturur. PGI yardımcı dalı, eğitim sırasında daha derin katmanlara güvenilir gradyan bilgisi sağlar ve bu bilgi, modeli hafif tutmak için çıkarım sırasında kaldırılır.

  • Artıları: Zorlu testlerde olağanüstü doğruluk; karmaşık sahnelerde mükemmel bilgi saklama.
  • Dezavantajları: NMS gerektirir; mimari, standart dışı görevler için değiştirilmesi karmaşık olabilir; yeni nesillere kıyasla eşdeğer verim için daha ağır hesaplama yükü.

YOLO26 Mimarisi

YOLO26, çıkarım hızını ve dağıtım kolaylığını önceliklendirir.

  1. NMS Tasarım: Modeli bir-bir eşleşmeleri doğal olarak tahmin etmek üzere eğiterek, YOLO26 sezgisel NMS ortadan kaldırır. Bu, gecikme değişkenliğini azaltır ve TensorRT basitleştirir, çünkü verimli NMS artık bir bağımlılık değildir.
  2. MuSGD Optimizer: Moonshot AI'nın Kimi K2'sinden esinlenen bu optimizer, SGD momentumunu Muon optimizer'ın uyarlanabilir SGD birleştirir. Bu, bilgisayar görüşüne büyük dil modeli (LLM) eğitim stabilitesi sağlar.
  3. ProgLoss + STAL: Progressive Loss ve Soft-Target Assignment Loss (STAL) teknolojilerinin kullanılması, çapa içermeyen dedektörlerin genel zayıflığı olan küçük nesnelerin algılanmasını önemli ölçüde artırmaktadır.

Eğitim ve Ekosistem

Geliştirici deneyimi, büyük ölçüde içinde bulundukları yazılım ekosistemleri nedeniyle, iki model arasında önemli ölçüde farklılık gösterir.

Ultralytics ile Kullanım Kolaylığı

YOLOv9 , Ultralytics entegre YOLOv9 , YOLO26 ise Ultralytics doğal bir parçasıdır. Bu sayede, aşağıdakiler dahil olmak üzere tüm özellikler için ilk günden itibaren destek sağlanır:

  • Birleşik API: Gibi görevler arasında geçiş yapın Poz Tahmini veya Yönlendirilmiş Sınırlayıcı Kutular (OBB) sadece model ağırlık dosyasını değiştirerek (örneğin, yolo26n-pose.pt).
  • Ultralytics : Ultralytics kullanarak veri setlerini sorunsuz bir şekilde yükleyin, AI asistanlarıyla açıklama ekleyin ve bulutta eğitim verin.
  • Dışa Aktarım Esnekliği: Tek tıklamayla aşağıdaki formatlara dışa aktarım için yerel destek CoreML , Android TFLite ve Intel OpenVINO gibi formatlara tek tıklamayla dışa aktarma için iOS destek.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")

Bellek ve Kaynak Verimliliği

YOLO26, YOLOv9 çift dallı mimarisine (PGI) kıyasla eğitim sırasında genellikle daha az GPU gerektirir. Bu, araştırmacıların NVIDIA 3060 veya 4090 gibi tüketici sınıfı donanımlarda daha büyük parti boyutları kullanmasına olanak tanıyarak deney döngüsünü hızlandırır.

Gerçek Dünya Kullanım Durumları

YOLOv9 Ne Zaman Tercih Edilmeli?

YOLOv9 , statik benchmarklarda maksimum doğruluğun tek öncelik olduğu ve hesaplama kaynaklarının bol olduğu senaryolar için güçlü bir rakip YOLOv9 .

  • Akademik Araştırma: CNN'lerde bilgi darboğazı teorisi ve gradyan akışını inceleme.
  • Sunucu Tarafında İşleme: Gerçek zamanlı gecikmenin çok önemli olmadığı durumlarda, arşivlenmiş video görüntülerini analiz eden yüksek güçlü GPU .

YOLO26 Ne Zaman Seçilmeli

YOLO26, üretim ortamları ve uç bilgi işlem için önerilen seçimdir.

  • Gömülü Sistemler: %43'e varan daha hızlı CPU hızı, robotikte Raspberry Pi veya NVIDIA dağıtımları için idealdir.
  • Gerçek Zamanlı Analitik: NMS tasarım, otonom sürüş ve güvenlik sistemleri için kritik öneme sahip deterministik gecikmeyi garanti eder.
  • Çok Modlu Uygulamalar: Örnek Segmentasyonu ve Poz için yerel destek ile, perakende veya spor alanlarında insan davranış analizi gibi karmaşık süreçler backbone çok yönlü bir backbone görevi görür.

Sonuç

YOLOv9 , PGI ile çığır açan teorik kavramlar YOLOv9 , YOLO26 bu dersleri pragmatik, yüksek performanslı bir pakete dönüştürür. Uçtan uca mimarisi, son işlem darboğazlarının ortadan kaldırılması ve sağlam Ultralytics entegrasyonu, onu yeni nesil AI uygulamaları geliştiren geliştiriciler için üstün bir seçim haline getirir.

Diğer Modelleri İnceleyin

Diğer seçenekleri keşfetmek istiyorsanız, şunu inceleyebilirsiniz YOLO11veya YOLOv10'yi inceleyebilirsinizNMS


Yorumlar