İçeriğe geç

YOLOv7 - YOLOv9 Karşılaştırması: Kapsamlı Teknik Bir Karşılaştırma

YOLO (You Only Look Once) ailesinin evrimi, çıkarım hızı, doğruluk ve hesaplama verimliliği arasındaki kritik ödünleşimleri dengeleyerek sinir ağı mimarisindeki sürekli yeniliklerle işaretlenmiştir. Bu karşılaştırma, eğitilebilir "bedava hediyeler çantası" ile bilinen 2022'den bir kilometre taşı sürümü olan YOLOv7 ve derin ağlardaki bilgi darboğazlarının üstesinden gelmek için Programlanabilir Gradyan Bilgisi'ni (PGI) tanıtan bir 2024 mimarisi olan YOLOv9'a odaklanmaktadır.

Performans ve Verimlilik Analizi

YOLOv7'den YOLOv9'a geçiş, parametre verimliliğinde önemli bir sıçramayı temsil etmektedir. YOLOv7, Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN) kullanılarak gerçek zamanlı nesne algılamanın sınırlarını zorlamak için optimize edilmişken, YOLOv9, daha az parametre ve Kayan Nokta İşlemleri (FLOP'lar) ile daha yüksek Ortalama Ortalama Hassasiyet (mAP) elde etmesini sağlayan mimari değişiklikler getirmektedir.

Uç nokta AI dağıtımına odaklanan geliştiriciler için bu verimlilik çok önemlidir. Aşağıdaki tabloda gösterildiği gibi, YOLOv9e, rekabetçi bir hesaplama ayak izini korurken daha büyük YOLOv7x'i aşarak baskın bir %55,6 mAP'ye ulaşır. Tersine, daha küçük YOLOv9t, YOLOv7'nin aynı ayrıntı düzeyiyle açıkça hedeflemediği, yüksek düzeyde kısıtlanmış cihazlar için hafif bir çözüm sunar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

YOLOv7: Eğitilebilir Ücretsiz Avantajlar Paketini Optimize Etme

Temmuz 2022'de piyasaya sürülen YOLOv7, çıkarım maliyetini artırmadan eğitim sürecini optimize etmeye odaklanarak YOLO mimarisinde çeşitli yapısal reformlar sunmuştur.

Mimari Öne Çıkanlar

YOLOv7, ağın daha etkili bir şekilde daha fazla özellik öğrenmesini sağlamak için en kısa ve en uzun gradyan yollarını kontrol eden E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı)'nı kullanır. Ayrıca, derinlik ve genişliğin aynı anda ölçeklenmesine izin veren, birleştirme tabanlı modeller için model ölçeklendirmesini popüler hale getirdi. Önemli bir yenilik, hızı artırmak için çıkarım sırasında model mimarisini kolaylaştıran planlı yeniden parametrelendirilmiş evrişimdir.

Eski Durum

YOLOv7 yetenekli bir model olmaya devam etse de, Ultralytics ekosisteminde bulunan daha yeni optimizasyonlar için yerel desteği yoktur. Geliştiriciler, modern MLOps araçlarıyla entegrasyonu daha yeni yinelemelere kıyasla daha zor bulabilir.

YOLOv7 hakkında daha fazla bilgi edinin

YOLOv9: Bilgi Darboğazını Çözme

2024'ün başlarında tanıtılan YOLOv9, derin öğrenmedeki temel bir sorunu ele alıyor: veri ardışık katmanlardan geçerken bilgi kaybı.

Mimari Öne Çıkanlar

YOLOv9'daki temel yenilik Programlanabilir Gradyan Bilgisi (PGI)'dir. Derin ağlarda, faydalı bilgiler ileri besleme sürecinde kaybolabilir ve bu da güvenilmez gradyanlara yol açabilir. PGI, kayıp fonksiyonu için temel bilgilerin korunmasını sağlayan yardımcı bir denetim çerçevesi sağlar. Ek olarak, Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN), parametrelerin ve hesaplama kaynaklarının kullanımını en üst düzeye çıkararak ELAN'ın yeteneklerini rastgele engellemeye izin vererek genişletir.

Bu mimari, YOLOv9'u karmaşık ortamlarda küçük nesneleri algılama veya yüksek çözünürlüklü hava görüntüleme analizi gibi karmaşık algılama görevleri için son derece güçlü kılar.

YOLOv9 hakkında daha fazla bilgi edinin

Neden Ultralytics Modelleri (YOLO11 ve YOLOv8) Tercih Edilen Seçimdir

YOLOv7 ve YOLOv9 etkileyici akademik başarılar olsa da, Ultralytics YOLO serisi ( YOLOv8 ve son teknoloji YOLO11 dahil) özellikle pratik, gerçek dünya uygulama geliştirme için tasarlanmıştır. Bu modeller kullanım kolaylığına, ekosistem entegrasyonuna ve operasyonel verimliliğe öncelik vererek çoğu mühendislik ekibi için üstün bir seçim haline gelir.

Kolaylaştırılmış Kullanıcı Deneyimi

Ultralytics modelleri, eğitim ardışık düzenlerinin karmaşıklıklarını ortadan kaldıran birleşik bir Python API içinde sarmalanmıştır. Nesne algılama, örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) görevleri arasında geçiş yapmak yalnızca tek bir argüman değişikliği gerektirir; bu, standart YOLOv7 veya YOLOv9 uygulamalarında bulunmayan bir çok yönlülüktür.

from ultralytics import YOLO

# Load a model (YOLO11 automatically handles architecture)
model = YOLO("yolo11n.pt")  # Load a pretrained model

# Train the model with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Perform inference on an image
results = model("path/to/image.jpg")

İyi Yönetilen Ekosistem

Bir Ultralytics modeli seçmek, güçlü bir ekosisteme erişim sağlar. Bu, bulut eğitimi ve veri kümesi yönetimi için Ultralytics HUB (ve yakında çıkacak olan Ultralytics Platformu) ile sorunsuz entegrasyonu içerir. Ayrıca, aktif topluluk ve sık güncellemeler, TensorRT veya optimum çıkarım hızları için OpenVINO'ya dışa aktarma gibi en son donanımlarla uyumluluğu sağlar.

Bellek ve Eğitim Verimliliği

Ultralytics modelleri, eğitim verimlilikleriyle ünlüdür. Bellek açlığı ve yavaş yakınsama gösterebilen transformatör tabanlı modellerin ( RT-DETR gibi) aksine, Ultralytics YOLO modelleri, daha düşük CUDA bellek gereksinimleriyle hızlı eğitim süreleri sağlamak için optimize edilmiş veri yükleyicileri ve Mozaik artırma kullanır. Bu, geliştiricilerin tüketici sınıfı GPU'larda son teknoloji modelleri eğitmesine olanak tanır.

YOLO11 hakkında daha fazla bilgi edinin

İdeal Kullanım Senaryoları

Doğru modeli seçmek, projenizin özel kısıtlamalarına bağlıdır.

YOLOv9 için Gerçek Dünya Uygulamaları

  • Araştırma ve Kıyaslama: COCO veri kümesinde bildirilen mutlak en yüksek doğruluğu gerektiren akademik çalışmalar için idealdir.
  • Yüksek Doğruluklu Gözetim: %1-2'lik bir doğruluk kazancının daha yüksek uygulama karmaşıklığını haklı çıkardığı güvenlik alarm sistemleri gibi senaryolarda.

YOLOv7 için Gerçek Dünya Uygulamaları

  • Eski Sistemler: Tüm kod tabanını yeniden düzenlemeden kararlı, bilinen bir nicelik gerektiren Darknet veya erken PyTorch ekosistemleri üzerine zaten inşa edilmiş projeler.

Ultralytics YOLO11 için Gerçek Dünya Uygulamaları

  • Akıllı Şehirler: Hızın ve dağıtım kolaylığının çok önemli olduğu trafik akışı analizi için nesne takibi kullanma.
  • Healthcare: Segmentasyon ve detect işlemlerinin genellikle aynı anda gerekli olduğu tıbbi görüntü analizi.
  • Üretim: NVIDIA Jetson veya Raspberry Pi gibi uç cihazlarda kalite kontrol sistemleri dağıtmak, TFLite ve ONNX'e basit dışa aktarma seçeneklerinden yararlanmak.

Sonuç

Hem YOLOv7 hem de YOLOv9, bilgisayar görüşü tarihinde önemli kilometre taşlarını temsil etmektedir. YOLOv9, PGI mimarisi ile v7'ye göre daha iyi verimlilik ve doğruluk sunarak zorlayıcı bir yükseltme sunmaktadır. Ancak, çok yönlü, kullanımı kolay ve iyi desteklenen bir çözüm arayan geliştiriciler için Ultralytics YOLO11 önerilen seçim olmaya devam etmektedir. Performans, kapsamlı dokümantasyon ve çoklu görev yeteneklerinin (detect, segment, classify, pose) dengesi, konseptten üretime en hızlı yolu sağlar.

Diğer Modelleri İnceleyin

Belirli bilgisayar görüşü görevleriniz için mükemmel uyumu bulmak için, bu diğer karşılaştırmaları keşfetmeyi düşünebilirsiniz:


Yorumlar