YOLO26 ve YOLOv9: Gerçek Zamanlı Nesne Algılamada Bir Sonraki Evrim

Bilgisayarlı görü dünyası hızla gelişiyor ve yeni mimariler sürekli olarak hız ve doğruluk sınırlarını zorluyor. Bu teknik karşılaştırmada, gerçek zamanlı nesne algılama alanında oldukça etkili iki model olan YOLO26 ve YOLOv9 arasındaki farkları inceliyoruz. Her iki model de kendine özgü mimari yenilikler sunsa da, performans ödünleşimlerini, dağıtım yeteneklerini ve donanım gereksinimlerini anlamak, bir sonraki görü projen için doğru aracı seçmek adına çok önemlidir.

YOLO26: Uç Birimler İçin Optimize Edilmiş Güç Merkezi

2026'nın başlarında piyasaya sürülen Ultralytics YOLO26, dağıtım verimliliği ve model eğitimi kararlılığında nesilsel bir sıçramayı temsil eder. Doğal olarak uçtan uca (end-to-end) bir çerçeve olacak şekilde tasarlanmış olup, geçmişte uç (edge) yapay zeka uygulamalarını engelleyen dağıtım darboğazlarını doğrudan çözer.

Model Detayları:

Mimari ve Yenilikler

YOLO26, Uçtan Uca NMS'siz Tasarım tanıtarak işlem sonrası (post-processing) sürecini temelden yeniden tasarlar. Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırarak, model belirgin şekilde daha düşük gecikme değişkenliği elde eder. Bu durum, özellikle ONNX ve Apple CoreML gibi çerçevelere dışa aktarırken mobil ve uç platformlara dağıtımı önemli ölçüde kolaylaştırır.

Ayrıca, Distribution Focal Loss (DFL) kaldırılması, dışa aktarma sürecini kolaylaştırır ve düşük güçlü mikro denetleyicilerle uyumluluğu artırır. Eğitim kararlılığını iyileştirmek için YOLO26, Stochastic Gradient Descent (SGD) ve Muon'un (Büyük Dil Modeli eğitimindeki yeniliklerden esinlenilmiştir) bir melezi olan yeni MuSGD Optimizer'ı entegre eder. Bu, zorlu veri kümelerinde daha hızlı yakınsama ve daha sağlam özellik çıkarımı sağlar.

Uç Cihaz Çıkarımı

Mimari basitleştirmeler ve DFL'nin kaldırılması sayesinde YOLO26, %43'e kadar daha hızlı CPU çıkarımı elde ederek Raspberry Pi veya NVIDIA Jetson Nano gibi kaynak kısıtlı uç cihazlar için ideal bir seçim haline gelir.

İHA hava görüntüleri gibi sahnelerdeki oldukça zorlu öğeleri algılamak için YOLO26, güncellenmiş ProgLoss + STAL kayıp fonksiyonlarını kullanır. Bunlar, küçük nesne tanıma geri çağırmasında (recall) önemli iyileştirmeler sağlar. Ayrıca, örnek bölümleme için çok ölçekli proto, poz tahmini için Residual Log-Likelihood Estimation (RLE) ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) algılamak için özel açı kaybı gibi göreve özel iyileştirmeler içerir.

YOLO26 hakkında daha fazla bilgi edin

YOLOv9: Programlanabilir Gradyan Bilgisi

2024'ün başlarında tanıtılan YOLOv9, sinir ağlarının eğitim aşamasında gradyan akışını ele alma biçimine teorik ilerlemeler getirerek parametre verimliliğine ve derin özelliklerin korunmasına odaklanmıştır.

Model Detayları:

Mimari ve Güçlü Yönler

YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) kavramı etrafında inşa edilmiştir. Bu kavramlar, derin sinir ağlarında sıklıkla gözlemlenen bilgi darboğazı sorununu ele alır. İleri besleme süreci boyunca temel bilgileri koruyarak GELAN, ağırlık güncellemeleri için kullanılan gradyanların güvenilir kalmasını sağlar. Bu mimari, yüksek doğruluk sağlar ve YOLOv9'u PyTorch çerçevesini kullanarak sinir ağı teorisi ve gradyan yolu optimizasyonu üzerine akademik araştırmalar için güçlü bir aday yapar.

Sınırlamalar

Mükemmel parametre verimliliğine rağmen YOLOv9, sınırlayıcı kutu işlem sonrası süreci için büyük ölçüde geleneksel NMS'ye güvenir; bu da uç cihazlarda çıkarım sırasında hesaplama darboğazları yaratabilir. Ayrıca, resmi depo büyük ölçüde nesne algılamaya odaklanmıştır ve takip veya poz tahmini gibi özel görevlere uyarlamak için önemli ölçüde özel mühendislik gerektirir.

YOLOv9 hakkında daha fazla bilgi edin

Performans Karşılaştırması

When evaluating these models for real-world deployment, balancing accuracy (mAP), inference speed, and memory usage is critical. Ultralytics models are renowned for their low memory requirements during both training and inference, requiring far less CUDA memory than transformer-based alternatives like RT-DETR.

Aşağıda, COCO veri kümesinde YOLO26 ve YOLOv9 performansının doğrudan bir karşılaştırması yer almaktadır. Her sütundaki en iyi değerler kalın olarak vurgulanmıştır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Not: YOLOv9 için CPU hızları, NMS yapılandırmasına bağlı olarak büyük ölçüde değiştiğinden ve genel olarak YOLO26'nın yerel NMS'siz uygulamasından daha yavaş olduğundan hariç tutulmuştur.

Kullanım Durumları ve Öneriler

YOLO26 ve YOLOv9 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman YOLO26 Seçilmeli

YOLO26 aşağıdakiler için güçlü bir seçimdir:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ne Zaman YOLOv9 Seçilmeli

YOLOv9 şunlar için önerilir:

  • Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
  • Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
  • Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.

Ultralytics Avantajı

Bir model seçmek, sadece bir doğruluk kıyaslaması okumaktan daha fazlasını içerir; çevredeki yazılım ekosistemi, veri toplamadan üretime ne kadar hızlı geçebileceğini belirler.

Kullanım Kolaylığı ve Ekosistem

Ultralytics Python API, kusursuz bir "sıfırdan zirveye" deneyimi sunar. Karmaşık depoları klonlamak veya dağıtık eğitim komut dosyalarını manuel olarak yapılandırmak yerine, geliştiriciler paketi pip aracılığıyla kurabilir ve hemen eğitime başlayabilir. Aktif olarak sürdürülen Ultralytics ekosistemi, sık güncellemeleri, Weights & Biases gibi ML platformlarıyla otomatik entegrasyonları ve kapsamlı dokümantasyonu garanti eder.

Diğer Ultralytics Modelleri

Ultralytics ekosistemindeki diğer modelleri keşfetmekle ilgileniyorsan, her ikisi de özel uygulamalar için olağanüstü esneklik sağlayan YOLO11 veya klasik YOLOv8 modellerini karşılaştırmayı düşünebilirsin.

Görü Görevlerinde Çok Yönlülük

YOLOv9 öncelikle bir algılama motoru olsa da, YOLO26 çok amaçlı bir görü aracıdır. Tek ve birleşik bir sözdizimi kullanarak, nesne algılamadan piksel hassasiyetinde görüntü bölümlemeye veya tüm görüntü sınıflandırmasına kolayca geçiş yapabilirsin. Bu çok yönlülük, farklı bilgisayarlı görü özellikleri için birden fazla bağlantısız kod tabanını korumanın teknik borcunu azaltır.

Verimli Eğitim ve Dağıtım

Eğitim verimliliği, Ultralytics felsefesinin temel taşıdır. YOLO26, kolayca bulunabilen önceden eğitilmiş ağırlıkları kullanır ve hantal görü transformer'larına kıyasla önemli ölçüde daha düşük bellek kullanımına sahiptir. Eğitildikten sonra, yerleşik dışa aktarma hatları, TensorRT veya TensorFlow Lite gibi optimize edilmiş formatlara tek tıkla dönüşümlere izin vererek üretime giden yolu pürüzsüzleştirir.

Kod Örneği: YOLO26 ile Başlarken

YOLO26'yı uygulamak oldukça basittir. Aşağıdaki Python kod parçacığı, önceden eğitilmiş bir modelin nasıl yükleneceğini, özel veriler üzerinde nasıl eğitileceğini ve Ultralytics API kullanılarak çıkarımın nasıl çalıştırılacağını gösterir.

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Uses GPU 0, or use 'cpu' for CPU training
)

# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes and confidences
predictions[0].show()

YOLO26'nın hızından, basitleştirilmiş mimarisinden ve sağlam ekosisteminden yararlanarak ekipler, gelişmiş görü yapay zeka uygulamalarını her zamankinden daha hızlı ve daha az teknik engelle pazara sunabilir.

Yorumlar