YOLOv9 ve YOLOv7: Modern Nesne Algılamaya Teknik Bir Bakış

Gerçek zamanlı nesne algılamanın evrimi, hesaplama verimliliği ile yüksek doğruluk arasında denge kurma arayışıyla şekillenmiştir. Bu yolculuktaki iki önemli mimari, her ikisi de Tayvan'daki Academia Sinica Bilgi Bilimleri Enstitüsü araştırmacıları tarafından geliştirilen YOLOv9 ve YOLOv7'dir. YOLOv7 eğitilebilir "bag-of-freebies" kavramını tanıtırken, daha yeni olan YOLOv9 derin öğrenmedeki bilgi darboğazlarını doğrudan hedef almaktadır.

Bu kapsamlı teknik karşılaştırma, her iki modelin mimari farklılıklarını, performans metriklerini ve ideal dağıtım senaryolarını inceleyerek ML mühendislerinin ve araştırmacıların bilgisayarlı görü projeleri için doğru aracı seçmelerine yardımcı olmaktadır.

Performans ve Metrik Karşılaştırması

Bu modelleri karşılaştırırken ham performans ve verimlilik kritik faktörlerdir. Aşağıdaki tablo, standart COCO veri seti kıyaslamaları için ortalama Hassasiyeti (mAP) ve hesaplama gereksinimlerini detaylandırmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
Performans Dengesi

YOLOv9c'nin, YOLOv7x (53.1 mAP) ile yaklaşık olarak aynı doğruluğa (53.0 mAP) ulaşırken, çok daha az parametre (25.3M'ye karşı 71.3M) ve FLOP kullandığına dikkat et. Bu, modern mimarilerdeki Performans Dengesi iyileştirmelerini göstermektedir.

YOLOv9: Bilgi Darboğazını Çözmek

2024 başında tanıtılan YOLOv9, derin sinir ağlarının veriyi katmanları boyunca nasıl koruduğunu temelden değiştirdi.

Mimari Yenilikler

YOLOv9, Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) ve Programlanabilir Gradyan Bilgisi (PGI) özelliklerini tanıtır. GELAN, parametre verimliliğini ve hesaplama maliyetini optimize etmek için CSPNet ve ELAN'ın güçlü yönlerini birleştirerek daha düşük parametre sayısıyla yüksek hassasiyet sağlar. PGI, derin ağlarda veri kaybını önlemek için tasarlanmış yardımcı bir denetim çerçevesidir ve eğitim sırasında ağırlıkları güncellemek için güvenilir gradyanlar oluşturur.

Güçlü Yönler ve Sınırlamalar

YOLOv9'un temel gücü, muazzam bir hesaplama yükü olmadan ince özellikleri ayıklama yeteneğidir; bu da onu tıbbi görüntü analizi gibi yüksek özellik sadakati gerektiren görevler için inanılmaz derecede yetenekli kılar. Ancak, eğitim sırasındaki karmaşık PGI yapısı, daha birleşik çerçevelere kıyasla yeni başlayanlar için özel mimari değişiklikleri daha zorlu hale getirebilir.

YOLOv9 hakkında daha fazla bilgi edin

YOLOv7: Bag-of-Freebies Öncüsü

2022'de piyasaya sürülen YOLOv7, gerçek zamanlı çıkarım hızlarını önemli ölçüde artıran yapısal yenilikler getirerek tüketici donanımlarında mümkün olanın sınırlarını belirleyen yeni bir kıyaslama oluşturdu.

Mimari Yenilikler

YOLOv7'nin temel katkısı, Genişletilmiş Verimli Katman Birleştirme Ağı (E-ELAN) mimarisidir. Bu yapı, modelin sürekli olarak daha çeşitli özellikleri öğrenmesini sağlar. Ayrıca YOLOv7, planlı yeniden parametrelendirilmiş evrişimler ve dinamik etiket ataması gibi "eğitilebilir bag-of-freebies" tekniklerini kullanır. Bu yöntemler, dağıtım sırasında çıkarım maliyetlerini artırmadan modelin eğitim sırasındaki doğruluğunu iyileştirir.

Güçlü Yönler ve Sınırlamalar

YOLOv7, gerçek zamanlı uç işleme için son derece optimize edilmiştir ve eski sistemlerde ve eski CUDA ortamlarında bir temel oluşturmaya devam etmektedir. Günümüzdeki temel sınırlaması, daha yeni modellere kıyasla daha büyük parametre boyutudur. Performans tablosunda görüldüğü gibi, üst düzey doğruluğa ulaşmak, eşdeğer modern mimarilere göre çok daha fazla GPU belleği gerektiren ağır YOLOv7x modelini zorunlu kılar.

YOLOv7 hakkında daha fazla bilgi edinin

Ultralytics Avantajı: Kolaylaştırılmış Dağıtım

YOLOv9 ve YOLOv7 için orijinal araştırma depoları mükemmel akademik temeller sunsa da, bu modelleri üretim ortamlarında dağıtmak karmaşık olabilir. Bunları ultralytics paketi aracılığıyla entegre etmek, benzersiz bir Kullanım Kolaylığı sunar.

Entegre Ultralytics Platformunu kullanarak geliştiriciler, sezgisel bir Python API, aktif topluluk desteği ve güçlü deney takibi içeren, iyi korunan bir ekosistemden yararlanırlar.

YOLO26 ile Geleceğe Hazırlık

Yeni bir bilgisayarlı görü projesine başlıyorsan, hem YOLOv9 hem de YOLOv7 yerine yeni çıkan YOLO26'yı incelemeni şiddetle öneririz. Yeni teknoloji standardı olarak yayınlanan YOLO26, çığır açan ilerlemeler getiriyor:

  • Uçtan Uca NMS-Free Tasarım: Non-Maximum Suppression (NMS) son işlem adımını ortadan kaldırarak dağıtım karmaşıklığını ve gecikmeyi önemli ölçüde azaltır.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Uç bilişim ortamları için optimize edilmiştir, uygulamanın özel GPU'lar olmadan bile sorunsuz çalışmasını sağlar.
  • MuSGD Optimizer: LLM eğitiminden ilham alan, son derece kararlı yakınsama sağlayan ve eğitim süresini kısaltan hibrit bir optimize edicidir.
  • DFL Kaldırma: Dağıtım Odaklı Kaybı (Distribution Focal Loss) kaldırarak model dışa aktarımını basitleştirir ve düşük güçlü mobil cihazlarla uyumluluğu artırır.
  • ProgLoss + STAL: Küçük nesne algılamada performansı önemli ölçüde artırarak hava görüntüleri ve gözetim için bir numaralı tercih haline gelir.

Other popular alternatives within the ecosystem include Ultralytics YOLOv8 and YOLO11, both of which offer massive versatility across tasks like instance segmentation and pose estimation.

Uygulama Örneği

Bu mimarilerden herhangi birini eğitmek ve dışa aktarmak, birleşik API ile inanılmaz derecede basittir. Aşağıdaki kod, Ultralytics araçlarının Eğitim Verimliliği özelliğini göstermektedir.

from ultralytics import YOLO

# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt")  # Swap with "yolo26n.pt" for faster edge performance

# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")
Bellek Gereksinimleri

Tüketici sınıfı donanımlarda eğitim yaparken bellek verimliliği çok önemlidir. Ultralytics'in YOLOv9 ve YOLO26 uygulamaları, eğitim sırasında genellikle ciddi bellek şişkinliğinden muzdarip olan transformer tabanlı modellerin (RT-DETR gibi) aksine, VRAM artışlarını azaltmak için yoğun bir şekilde optimize edilmiştir.

Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları

Bu mimariler arasında seçim yapmak genellikle üretim ortamının özel kısıtlamalarına bağlıdır.

Ne zaman YOLOv9 kullanmalısın: YOLOv9, ince detayların korunmasının gerekli olduğu ortamlarda öne çıkar. Güçlü özellik çıkarma yeteneği, raflardaki yoğun ürünleri saymak için perakende analitiği veya küçük yapraklardaki erken aşama mahsul hastalıklarını tanımlamanın kritik olduğu tarımsal uygulamalar için idealdir.

Ne zaman YOLOv7 kullanmalısın: YOLOv7, eski dağıtım boru hatları için güçlü bir aday olmaya devam ediyor. Google Coral Edge TPU'nun belirli nesilleri gibi eski donanım sistemlerine entegrasyon yapıyorsan, YOLOv7'nin basit CNN mimarisini derlemek, daha yeni modellerin karmaşık gradyan dallarına göre daha kolay olabilir.

Ne zaman YOLO26 kullanmalısın (Önerilen): Otonom dronlardan akıllı şehir trafik yönetimine kadar her türlü modern dağıtım için YOLO26 üstün tercihtir. NMS-free mimarisi, güvenlik açısından kritik robotik için gerekli olan deterministik çıkarım sürelerini garanti ederken, yüksek hassasiyeti hem YOLOv9 hem de YOLOv7'yi her alanda geride bırakmaktadır.

Yorumlar