İçeriğe geç

YOLOv7 vs YOLOv9: Kapsamlı Bir Teknik Karşılaştırma

YOLO (You Only Look Once) ailesinin evrimi, çıkarım hızı, doğruluk ve hesaplama verimliliği arasındaki kritik ödünleşimleri dengeleyen sinir ağı mimarisindeki sürekli yeniliklerle işaretlenmiştir. Bu karşılaştırma aşağıdakileri inceler YOLOv7eğitilebilir "bedava çantasıyla" bilinen 2022'nin kilometre taşı sürümü ve YOLOv9derin ağlardaki bilgi darboğazlarının üstesinden gelmek için Programlanabilir Gradyan Bilgisini (PGI) tanıtan 2024 mimarisi.

Performans ve Verimlilik Analizi

YOLOv7 'den YOLOv9 'a geçiş, parametre verimliliğinde önemli bir sıçramayı temsil etmektedir. YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN) kullanarak gerçek zamanlı nesne tespitinin sınırlarını zorlamak için optimize edilmişken, YOLOv9 daha az parametre ve Kayan Nokta İşlemleri (FLOP) ile daha yüksek Ortalama Ortalama HassasiyetmAP) elde etmesini sağlayan mimari değişiklikler getirmektedir.

Uç yapay zeka dağıtımına odaklanan geliştiriciler için bu verimlilik çok önemlidir. Aşağıdaki tabloda gösterildiği gibi YOLOv9e, rekabetçi bir hesaplama ayak izini korurken daha büyük YOLOv7x 'i geride bırakarak %55,6'lık baskın bir mAP elde ediyor. Buna karşılık, daha küçük olan YOLOv9t, YOLOv7 'nin aynı ayrıntı düzeyiyle açıkça hedeflemediği bir katman olan yüksek düzeyde kısıtlı cihazlar için hafif bir çözüm sunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

YOLOv7: Eğitilebilir Ücretsiz Çantanın Optimize Edilmesi

Temmuz 2022'de piyasaya sürülen YOLOv7 , çıkarım maliyetini artırmadan eğitim sürecini optimize etmeye odaklanarak YOLO mimarisine çeşitli yapısal reformlar getirmiştir.

Mimaride Öne Çıkanlar

YOLOv7 , ağın daha fazla özelliği etkili bir şekilde öğrenmesini sağlamak için en kısa ve en uzun gradyan yollarını kontrol eden E-ELAN'ı (Genişletilmiş Verimli Katman Toplama Ağı) kullanır. Ayrıca, birleştirme tabanlı modeller için model ölçeklendirmeyi popüler hale getirerek derinlik ve genişliğin aynı anda ölçeklendirilmesine olanak sağlamıştır. Önemli bir yenilik, hızı artırmak için çıkarım sırasında model mimarisini düzene sokan planlı yeniden parametreli konvolüsyondu.

Eski Durum

YOLOv7 yetenekli bir model olmaya devam ederken, Ultralytics ekosisteminde bulunan daha yeni optimizasyonlar için yerel destekten yoksundur. Geliştiriciler, modern MLOps araçlarıyla entegrasyonu daha yeni yinelemelere kıyasla daha zor bulabilirler.

YOLOv7 hakkında daha fazla bilgi edinin

YOLOv9: Bilgi Darboğazını Çözmek

2024'ün başlarında tanıtılan YOLOv9, derin öğrenmede temel bir sorunu ele alıyor: veriler ardışık katmanlardan geçerken bilgi kaybı.

Mimaride Öne Çıkanlar

YOLOv9 'daki temel yenilik Programlanabilir Gradyan Bilgisidir (PGI). Derin ağlarda, ileri besleme işlemi sırasında yararlı bilgiler kaybolabilir ve bu da güvenilir olmayan gradyanlara yol açabilir. PGI, kayıp fonksiyonu için önemli bilgilerin korunmasını sağlayan yardımcı bir denetim çerçevesi sağlar. Ayrıca, Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN), keyfi engellemeye izin vererek ELAN'ın yeteneklerini genişletir, parametrelerin ve hesaplama kaynaklarının kullanımını en üst düzeye çıkarır.

Bu mimari, YOLOv9 'u karmaşık ortamlardaki küçük nesnelerin tespiti veya yüksek çözünürlüklü hava görüntülerinin analizi gibi karmaşık tespit görevleri için son derece güçlü kılmaktadır.

YOLOv9 hakkında daha fazla bilgi edinin

Ultralytics ModelleriYOLO11 & YOLOv8) Neden Tercih Ediliyor?

YOLOv7 ve YOLOv9 etkileyici akademik başarılar olsa da Ultralytics YOLO serisi de dahil olmak üzere YOLOv8 ve son teknoloji ürünü YOLO11-pratik, gerçek dünya uygulama geliştirme için özel olarak tasarlanmıştır. Kullanım kolaylığı, ekosistem entegrasyonu ve operasyonel verimliliğe öncelik veren bu modeller, çoğu mühendislik ekibi için üstün bir seçimdir.

Kolaylaştırılmış Kullanıcı Deneyimi

Ultralytics modelleri, eğitim boru hatlarının karmaşıklıklarını soyutlayan birleşik bir Python API 'sine sarılmıştır. Nesne algılama, örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) görevleri arasında geçiş yapmak, standart YOLOv7 veya YOLOv9 uygulamalarında bulunmayan bir çok yönlülük olan yalnızca tek bir argüman değişikliği gerektirir.

from ultralytics import YOLO

# Load a model (YOLO11 automatically handles architecture)
model = YOLO("yolo11n.pt")  # Load a pretrained model

# Train the model with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Perform inference on an image
results = model("path/to/image.jpg")

Bakımlı Ekosistem

Bir Ultralytics modeli seçmek, sağlam bir ekosisteme erişim sağlar. Bu, bulut eğitimi ve veri kümesi yönetimi için Ultralytics HUB (ve yakında çıkacak olan Ultralytics Platform) ile sorunsuz entegrasyonu içerir. Ayrıca, aktif topluluk ve sık güncellemeler, en yeni donanımlarla uyumluluğu garanti eder, örneğin TensorRT veya OpenVINO optimum çıkarım hızları için.

Hafıza ve Eğitim Verimliliği

Ultralytics modelleri eğitim verimliliği ile ünlüdür. Transformatör tabanlı modellerin aksine (örneğin RT-DETR) bellek gerektiren ve yakınsaması yavaş olabilen Ultralytics YOLO modelleri, daha düşük CUDA bellek gereksinimleriyle hızlı eğitim süreleri sağlamak için optimize edilmiş veri yükleyicileri ve Mosaic artır ma kullanır. Bu, geliştiricilerin tüketici sınıfı GPU'larda son teknoloji modelleri eğitmelerine olanak tanır.

YOLO11 hakkında daha fazla bilgi edinin

İdeal Kullanım Senaryoları

Doğru modelin seçilmesi, projenizin özel kısıtlamalarına bağlıdır.

YOLOv9 için Gerçek Dünya Uygulamaları

  • Araştırma ve Kıyaslama: COCO veri setinde mutlak en yüksek raporlanan doğruluğu gerektiren akademik çalışmalar için idealdir.
  • Yüksek Doğruluklu Gözetim: Güvenlik alarm sistemleri gibi senaryolarda %1-2'lik bir doğruluk kazancı daha yüksek uygulama karmaşıklığını haklı çıkarır.

YOLOv7 için Gerçek Dünya Uygulamaları

  • Eski Sistemler: Darknet veya erken PyTorch ekosistemleri üzerinde halihazırda inşa edilmiş olan ve tüm kod tabanını yeniden düzenlemeden kararlı, bilinen bir miktar gerektiren projeler.

Ultralytics için Gerçek Dünya UygulamalarıYOLO11

  • Akıllı Şehirler: Hız ve dağıtım kolaylığının çok önemli olduğu trafik akışı analizi için nesne tak ibinin kullanılması.
  • Sağlık Hizmetleri: Segmentasyon ve algılamanın genellikle aynı anda gerekli olduğutıbbi görüntü analizi.
  • Üretim: Kalite kontrol sistemlerini NVIDIA Jetson veya Raspberry Pi gibi uç cihazlara dağıtarak TFLite ve ONNX'e kolay dışa aktarma seçeneklerinden yararlanma.

Sonuç

Hem YOLOv7 hem de YOLOv9 bilgisayarla görme tarihinde önemli kilometre taşlarını temsil etmektedir. YOLOv9 PGI mimarisi ile v7'ye göre cazip bir yükseltme sunarak daha iyi verimlilik ve doğruluk sağlar. Ancak , çok yönlü, kullanımı kolay ve iyi desteklenen bir çözüm arayan geliştiriciler için, Ultralytics YOLO11 önerilen seçim olmaya devam etmektedir. Performans dengesi, kapsamlı dokümantasyonu ve çoklu görev yetenekleridetect, segment, classify, pozlama) konseptten üretime giden en hızlı yolu sağlar.

Diğer Modelleri İnceleyin

Özel bilgisayarla görme görevleriniz için mükemmel uyumu bulmak için, bu diğer karşılaştırmaları keşfetmeyi düşünün:


Yorumlar