YOLOv9 ve YOLOv6-3.0: Kapsamlı Bir Teknik Karşılaştırma

Gerçek zamanlı nesne algılamanın evrimi, sinir ağı mimarilerindeki sürekli yenilikler ile tetiklenerek çıkarım hızı, doğruluk ve hesaplama verimliliği arasındaki hassas dengeyi optimize etmiştir. Geliştiriciler ve araştırmacılar bilgisayarlı görü çerçevelerinin kalabalık dünyasında yollarını bulurken, en doğru aracı seçmek için önde gelen mimarileri karşılaştırmak şarttır.

Bu teknik kılavuz, iki oldukça yetenekli model arasında derinlemesine bir karşılaştırma sunar: derin öğrenmede bilgi tutma yeteneğiyle ünlü YOLOv9 ve endüstriyel uygulamalar için özel olarak tasarlanmış YOLOv6-3.0.

YOLOv9 Genel Bakış: Özellik Tutma Kapasitesini En Üst Düzeye Çıkarma

2024 başında tanıtılan YOLOv9, derin sinir ağlarındaki en kalıcı zorluklardan birini ele alıyor: ileri besleme süreci sırasında bilgi kaybı. Gradyanların güvenilir olmasını ve özellik haritalarının kritik verileri korumasını sağlayarak teorik doğruluk sınırlarını zorluyor.

  • Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
  • Organizasyon: Institute of Information Science, Academia Sinica, Tayvan
  • Tarih: 21 Şubat 2024
  • Bağlantılar: Arxiv Makalesi, GitHub Deposu

Mimari ve Metodolojiler

YOLOv9, Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) ile birlikte Programlanabilir Gradyan Bilgisi (PGI) kavramını tanıtıyor. PGI, ana ağın çıkarım yükü eklemeden sağlam, güvenilir özellikler öğrenmesini sağlayan yardımcı bir denetim sunarak bilgi darboğazını çözüyor. Bu sırada GELAN, parametre kullanımını optimize ederek modelin, hesaplama maliyetini yönetilebilir tutarken en gelişmiş ortalama Hassasiyet (mAP) değerlerine ulaşmasını sağlıyor. Bu, onu tıbbi görüntü analizi veya özellik sadakatinin kritik olduğu son derece küçük nesnelerin tespiti için olağanüstü bir seçenek haline getiriyor.

YOLOv9 hakkında daha fazla bilgi edin

YOLOv6-3.0 Genel Bakış: Endüstriyel Ölçek İçin Tasarlandı

Meituan tarafından geliştirilen YOLOv6-3.0 (ayrıca v3.0 olarak da bilinir), ağır hizmet endüstriyel uygulamalara hizmet etmek üzere sıfırdan tasarlandı. 2023 başında piyasaya sürülen model, dağıtım verimliliğine odaklanarak uç donanımlarda üstün performans gösteren niceleme dostu bir model paketi sunuyor.

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
  • Kuruluş: Meituan
  • Tarih: 13 Ocak 2023
  • Bağlantılar: Arxiv Makalesi, GitHub Deposu

Mimari ve Metodolojiler

YOLOv6-3.0; RepOptimizer ve Çapa Destekli Eğitim (AAT) stratejileriyle öne çıkıyor. Model, katmanları birleştirerek çıkarım sırasında GPU'larda olağanüstü hızlı çalışmasını sağlayan, RepVGG'den ilham alan donanım farkında bir sinir ağı tasarımı kullanıyor. 3.0 güncellemesi, yerelleştirme doğruluğunu artırmak için Çift Yönlü Birleştirme (BiC) modülünü tanıtarak mimariyi daha da iyileştirdi. TensorRT ve OpenVINO gibi dağıtım formatları için oldukça optimize edildiğinden, YOLOv6-3.0 lojistik, üretim otomasyonu ve yüksek verimli sunucu ortamlarında sıklıkla tercih ediliyor.

YOLOv6-3.0 hakkında daha fazla bilgi edin

Performans Karşılaştırması

Bu modelleri standart COCO veri kümesi üzerinde değerlendirirken, doğruluk ve ham çıkarım hızı arasındaki belirgin dengeyi gözlemleyebiliriz.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Teknik Analiz

YOLOv6-3.0n, T4 donanımında ham hız konusunda (1.17ms) liderliği alırken, YOLOv9t, parametrelerin yarısından azını (2.0M'ye karşı 4.7M) ve önemli ölçüde daha az FLOP kullanarak biraz daha yüksek mAP (%38.3) elde etmeyi başarıyor. Karmaşık ve yüksek doğruluk gerektiren durumlar için devasa YOLOv9e, doğruluk oranını %55.6 mAP seviyesine taşıyarak PGI mimarisinin derin ağlardaki gücünü gösteriyor.

YOLO26 ile Projeni Geleceğe Hazırla

Yeni bir bilgisayarlı görü girişimi başlatıyorsan, YOLO26 kullanmanı şiddetle tavsiye ediyoruz. 2026'da piyasaya sürülen model, işlem sonrası gecikmeyi tamamen ortadan kaldıran ve %43'e kadar Daha Hızlı CPU Çıkarımı sağlayan yerel bir Uçtan Uca NMS'siz Tasarıma sahip.

Ultralytics Ekosistem Avantajı

Hangi modelin mimari felsefesi sana daha yakın gelirse gelsin, bunları Ultralytics Python API üzerinden yerel olarak uygulamak üstün bir geliştirici deneyimi sunar.

Kullanım Kolaylığı ve Eğitim Verimliliği

Karmaşık derin öğrenme modellerini eğitmek geleneksel olarak çok fazla standart kod gerektirir. Ultralytics Platform bu karmaşıklıkları soyutlar. İster kusur tespiti için YOLOv9'u ince ayar yapıyor ol, ister mobil uygulamalar için YOLOv6'yı dışa aktarıyor ol, iş akışı son derece tutarlı kalır.

Ayrıca, Ultralytics mimarileri genellikle eğitim sırasında büyük boyutlu transformer tabanlı modellere kıyasla daha düşük CUDA bellek gereksinimlerine sahiptir. Bu, geliştiricilerin tüketici sınıfı GPU'larda daha büyük yığın boyutları kullanmasına olanak tanıyarak eğitim verimliliğini büyük ölçüde artırır.

from ultralytics import YOLO

# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")

# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Export to ONNX or TensorRT seamlessly
model.export(format="engine", half=True)

Görü Görevlerinde Eşsiz Çok Yönlülük

YOLOv6-3.0 hızlı sınırlayıcı kutu üretimi için yoğun bir şekilde optimize edilmiş olsa da, modern bilgisayarlı görü projeleri genellikle çok görevli bir yaklaşım gerektirir. Ultralytics modelleri, aşırı çok yönlülükleri ile övülür. Ultralytics YOLOv8 ve daha yeni olan YOLO26 gibi araçlarla, tek bir çerçeve nesne algılama, örnek bölümleme, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) sorunsuz bir şekilde yönetir.

YOLO26 ile Tanışın: Yeni Standart

Hem performansı hem de dağıtım kolaylığını en üst düzeye çıkarmak isteyen kuruluşlar için YOLO26, hız ve doğruluğun nihai birleşimini temsil eder.

YOLO11'in başarıları üzerine inşa edilen YOLO26, paradigma değiştiren birkaç özellik sunar:

  • MuSGD İyileştirici: Moonshot AI'ın Kimi K2'si gibi Büyük Dil Modeli (LLM) eğitim tekniklerinden ilham alan bu hibrit iyileştirici, son derece kararlı bir eğitim ve hızlı yakınsama sağlar.
  • DFL Kaldırma: Distribution Focal Loss'u kaldırarak YOLO26, dışa aktarma grafiğini basitleştirir ve düşük güçlü uç bilişim çipleriyle çok daha uyumlu hale getirir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone operasyonları ve IoT uygulamaları için kritik öneme sahip küçük nesne tanımada kayda değer iyileştirmeler sağlar.
  • Göreve Özel İyileştirmeler: YOLO26, bölümleme için yerel çok ölçekli prototipleme, iskelet takibi için Residual Log-Likelihood Estimation (RLE) ve OBB tespitindeki uç durumları çözmek için özel açı kaybı algoritmaları içerir.

İdeal Dağıtım Senaryoları

Doğru mimariyi seçmek nihayetinde senin üretim kısıtlamalarına bağlıdır.

Endüstriyel üretimde yerleşik bir boru hattın varsa, büyük ölçüde nicelemeye güveniyorsan ve mutlak en düşük milisaniye altı donanım gecikmesine ihtiyaç duyduğun özel çıkarım hızlandırıcıları kullanıyorsan YOLOv6-3.0'ı seç.

Karmaşık sağlık teşhisleri veya ince, piksel seviyesindeki özellikleri kaçırmanın bir seçenek olmadığı uzun menzilli gözetim projeleriyle uğraşıyorsan YOLOv9'u seç.

Bununla birlikte, basitleştirilmiş ve NMS'siz dağıtımın yanı sıra en son teknoloji doğruluk sunan mükemmel dengeli bir yaklaşım için Ultralytics YOLO26, modern bilgisayarlı görü mühendisliği için kesin önerimizdir. Aktif geliştirme döngüsü, kapsamlı dokümantasyonu ve canlı topluluk desteği, onu araştırmacılar ve geliştiriciler için vazgeçilmez bir araç haline getirir.

Yorumlar