YOLOv9 vs YOLOv7: Modern Nesne Tespitine Teknik Bir Derin Dalış
Gerçek zamanlı nesne tespitinin evrimi, hesaplama verimliliği ile yüksek doğruluğu dengeleme arayışıyla şekillenmiştir. Bu yolculuktaki iki dönüm noktası mimarisi YOLOv9 ve YOLOv7'dir; her ikisi de Tayvan'daki Academia Sinica Bilgi Bilimi Enstitüsü'ndeki araştırmacılar tarafından geliştirilmiştir. YOLOv7 devrim niteliğinde eğitilebilir 'bag-of-freebies' tanıtırken, daha yeni YOLOv9, derin öğrenme bilgi darboğazlarını doğrudan ele almaktadır.
Bu kapsamlı teknik karşılaştırma, her iki model için mimari farklılıkları, performans metrikleri ve ideal dağıtım senaryolarını inceleyerek ML mühendislerinin ve araştırmacıların bilgisayar görüşü iş akışları için doğru aracı seçmelerine yardımcı olur.
Performans ve Metrik Karşılaştırması
Bu modelleri karşılaştırırken, ham performans ve verimlilik kritik faktörlerdir. Aşağıdaki tablo, standart COCO veri kümesi kıyaslamaları için ortalama Hassasiyet (mAP) ve hesaplama gereksinimlerini detaylandırmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Performans Dengesi
YOLOv9c'nin, önemli ölçüde daha az parametre (25.3M'ye karşı 71.3M) ve FLOP kullanarak YOLOv7x (53.1 mAP) ile yaklaşık olarak aynı doğruluğu (53.0 mAP) nasıl elde ettiğine dikkat edin. Bu, modern mimarilerdeki Performans Dengesi iyileştirmelerini göstermektedir.
YOLOv9: Bilgi Darboğazını Çözme
2024'ün başlarında tanıtılan YOLOv9, derin sinir ağlarının katmanları boyunca verileri nasıl koruduğunu temelden değiştirdi.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş:Institute of Information Science, Academia Sinica
- Tarih: 21 Şubat 2024
- Kaynaklar:Arxiv Makalesi | GitHub Deposu
Mimari Yenilikler
YOLOv9, Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) ve Programlanabilir Gradyan Bilgisi (PGI) sunar. GELAN, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre verimliliğini ve hesaplama maliyetini optimize eder, daha düşük parametre sayısıyla yüksek hassasiyet sağlar. PGI, derin ağlarda veri kaybını önlemek için tasarlanmış yardımcı bir denetim çerçevesidir ve eğitim süreci boyunca ağırlıkları güncellemek için güvenilir gradyanlar üretir.
Güçlü Yönler ve Sınırlamalar
YOLOv9'un ana gücü, muazzam hesaplama yükü olmadan ince özellikleri çıkarabilme yeteneğidir; bu da onu tıbbi görüntü analizi gibi yüksek özellik doğruluğu gerektiren görevler için inanılmaz derecede yetenekli kılar. Ancak, eğitim sırasındaki karmaşık PGI yapısı, özel mimari değişiklikleri daha birleşik çerçevelere kıyasla yeni başlayanlar için daha zor hale getirebilir.
YOLOv9 hakkında daha fazla bilgi edinin.
YOLOv7: 'Bag-of-Freebies' Öncüsü
2022'de piyasaya sürülen YOLOv7, tüketici donanımında nelerin mümkün olduğu konusunda yeni bir ölçüt belirledi ve gerçek zamanlı çıkarım hızlarını önemli ölçüde artıran yapısal yenilikler sundu.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş:Institute of Information Science, Academia Sinica
- Tarih: 6 Temmuz 2022
- Kaynaklar:Arxiv Makalesi | GitHub Deposu
Mimari Yenilikler
YOLOv7'nin temel katkısı Genişletilmiş Verimli Katman Birleştirme Ağı (E-ELAN)'dır. Bu mimari, modelin sürekli olarak daha çeşitli özellikler öğrenmesini sağlar. Ek olarak, YOLOv7, planlı yeniden parametrelendirilmiş evrişimler ve dinamik etiket ataması gibi teknikler olan "eğitilebilir bedelsizler torbası"nı kullanır. Bu yöntemler, dağıtım sırasında çıkarım maliyeti eklemeden modelin eğitim sırasındaki doğruluğunu artırır.
Güçlü Yönler ve Sınırlamalar
YOLOv7, gerçek zamanlı kenar işleme için yüksek düzeyde optimize edilmiştir ve eski sistemlerde ve eski CUDA ortamlarında temel bir unsur olmaya devam etmektedir. Günümüzdeki temel sınırlaması, yeni modellere kıyasla daha büyük parametre boyutudur. Performans tablosunda gösterildiği gibi, en üst düzey doğruluğa ulaşmak, eşdeğer modern mimarilere göre önemli ölçüde daha fazla GPU belleği talep eden ağır YOLOv7x modelini gerektirir.
YOLOv7 hakkında daha fazla bilgi edinin.
Ultralytics Avantajı: Kolaylaştırılmış Dağıtım
YOLOv9 ve YOLOv7 için orijinal araştırma depoları mükemmel akademik temeller sağlasa da, bu modelleri üretim ortamlarında dağıtmak karmaşık olabilir. Bunları şunlar aracılığıyla entegre etmek: ultralytics paketi eşsiz bir Kullanım Kolaylığı.
Entegre Ultralytics Platformu'nu kullanarak geliştiriciler, sezgisel bir Python API'si, aktif topluluk desteği ve sağlam deney takibi içeren, iyi yönetilen bir ekosistemden faydalanır.
YOLO26 ile Geleceğe Hazırlık
Yeni bir bilgisayar görüşü projesine başlıyorsanız, hem YOLOv9 hem de YOLOv7 yerine yeni piyasaya sürülen YOLO26'yı keşfetmenizi şiddetle tavsiye ederiz. Yeni en son teknoloji standardı olarak piyasaya sürülen YOLO26, çığır açan gelişmeler sunuyor:
- Uçtan Uca NMS-Serbest Tasarım: Maksimum Olmayan Bastırma (NMS) sonrası işlemeyi ortadan kaldırarak dağıtım karmaşıklığını ve gecikmeyi önemli ölçüde azaltır.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Uç bilişim ortamları için optimize edilmiştir, uygulamanızın özel GPU'lar olmadan bile sorunsuz çalışmasını sağlar.
- MuSGD Optimizatörü: LLM eğitiminden esinlenilmiş hibrit bir optimizatör olup, yüksek düzeyde kararlı yakınsama sağlar ve eğitim süresini azaltır.
- DFL Kaldırma: Dağıtım Odak Kaybı'nı (Distribution Focal Loss) kaldırarak model dışa aktarımını basitleştirir ve düşük güçlü mobil cihazlarla uyumluluğu artırır.
- ProgLoss + STAL: Küçük nesne algılamada performansı önemli ölçüde artırarak, hava görüntüleri ve gözetim için birinci sınıf bir seçenek haline getirir.
Ekosistemdeki diğer popüler alternatifler arasında Ultralytics YOLOv8 ve YOLO11 bulunmaktadır; her ikisi de örnek segmentasyon ve poz tahmini gibi görevlerde büyük çok yönlülük sunar.
Uygulama Örneği
Bu mimarilerden herhangi birini birleşik API ile eğitmek ve dışa aktarmak inanılmaz derecede basittir. Aşağıdaki kod, Ultralytics araçlarının karakteristik özelliği olan kolaylaştırılmış Eğitim Verimliliği'ni göstermektedir.
from ultralytics import YOLO
# Initialize YOLOv9 or the recommended YOLO26 model
model = YOLO("yolov9c.pt") # Swap with "yolo26n.pt" for faster edge performance
# Train on a custom dataset with built-in data augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")
Bellek Gereksinimleri
Tüketici sınıfı donanımda eğitim yaparken, bellek verimliliği çok önemlidir. YOLOv9 ve YOLO26'nın Ultralytics uygulamaları, eğitim sırasında genellikle ciddi bellek şişkinliğinden muzdarip olan transformatör tabanlı modellerin (RT-DETR gibi) aksine, VRAM ani yükselişlerini azaltmak için yoğun bir şekilde optimize edilmiştir.
Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları
Bu mimariler arasında seçim yapmak genellikle üretim ortamınızın özel kısıtlamalarına bağlıdır.
YOLOv9 Ne Zaman Kullanılmalı: YOLOv9, en küçük ayrıntıların korunmasının gerekli olduğu ortamlarda üstün performans gösterir. Sağlam özellik çıkarımı, onu raflardaki yoğun paketlenmiş ürünleri saymak için perakende analizi veya küçük yapraklardaki erken evre mahsul hastalığını tespit etmenin kritik olduğu tarım uygulamaları için ideal kılar.
YOLOv7 Ne Zaman Kullanılmalı: YOLOv7, eski dağıtım hatları için güçlü bir aday olmaya devam etmektedir. Eski donanım sistemlerine (örneğin Google Coral Edge TPU'nun belirli nesilleri gibi) entegre ediyorsanız, YOLOv7'nin basit CNN mimarisi, yeni modellerin daha karmaşık gradyan dallarından daha kolay derlenebilir.
YOLO26 Ne Zaman Kullanılmalı (Önerilen): Otonom dronlardan akıllı şehir trafik yönetimine kadar her türlü modern dağıtım için YOLO26 üstün bir seçimdir. NMS-serbest mimarisi, güvenlik açısından kritik robotik uygulamalar için temel olan deterministik çıkarım sürelerini garanti ederken, yüksek hassasiyeti ise hem YOLOv9 hem de YOLOv7'yi genel olarak geride bırakır.