İçeriğe geç

YOLOv7 YOLOv9: Gerçek Zamanlı Nesne Algılamanın Evrimi

Bilgisayar görüşü alanında hızlı bir evrim yaşanırken, YOLO You Only Look Once) ailesi gerçek zamanlı nesne algılamada sürekli olarak öncü rol oynamaktadır. Bu serideki iki önemli dönüm noktası şunlardır YOLOv7ve YOLOv9'dir. Her iki mimari de Academia Sinica Bilgi Bilimi Enstitüsü'ndeki araştırmacılar tarafından geliştirilmiş olsa da, derin öğrenme optimizasyonunun farklı nesillerini temsil etmektedir.

Bu kılavuz, bu iki güçlü modelin teknik karşılaştırmasını sunarak, mimari yeniliklerini, performans ölçütlerini ve Ultralytics ideal kullanım örneklerini analiz etmektedir.

Mimari Yenilikler

Bu modeller arasındaki temel fark, derin ağlar aracılığıyla özellik yayılımını ve gradyan akışını nasıl yönettiklerinde yatmaktadır.

YOLOv7: Ücretsiz Ekstralar Paketi

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao, YOLOv7E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı) kavramını ortaya attı. Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlar.

YOLOv7 , "Bag-of-Freebies" ile YOLOv7 Bu, çıkarım maliyetini artırmadan doğruluğu artıran bir dizi eğitim yöntemidir. Bunlar arasında, modelin eğitim sırasında daha iyi temsilleri öğrenmesine yardımcı olan, ancak daha hızlı dağıtım için model dışa aktarımı sırasında birleştirilen veya kaldırılan yeniden parametreleştirme teknikleri ve yardımcı baş denetimi bulunur.

YOLOv7 hakkında daha fazla bilgi edinin.

YOLOv9: Programlanabilir Gradyan Bilgisi

YOLOv9, Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından geliştirilen, derin ağlarda var olan "bilgi darboğazı" sorununu ele almaktadır. Veriler ardışık katmanlardan geçerken, girdi bilgileri sıklıkla kaybolur. YOLOv9 , Arxiv makalesinde ayrıntılı olarak açıklanan iki çığır açan kavramı YOLOv9 :

  1. GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı): CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre verimliliğini en üst düzeye çıkaran bir mimari.
  2. PGI (Programlanabilir Gradyan Bilgisi): Ağ ağırlıklarını güncellemek için güvenilir gradyanlar üreten ve modelin ağın derinliği boyunca önemli bilgileri muhafaza etmesini sağlayan yardımcı bir denetim çerçevesi.

YOLOv9 hakkında daha fazla bilgi edinin.

Performans Analizi

Mimariler arasında seçim yaparken, geliştiriciler ortalama hassasiyet (mAP), çıkarım hızı ve hesaplama maliyeti (FLOP) arasında denge kurmalıdır. Aşağıdaki tablo, COCO setindeki performans farklılıklarını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Temel Çıkarımlar

  • Verimlilik: YOLOv9m, YOLOv7l ile aynı doğruluğu (51,4% mAP) sağlar, ancak parametre sayısı yaklaşık %45 daha azdır (20,0 milyon karşı 36,9 milyon) ve FLOP değeri önemli ölçüde daha düşüktür.
  • Hız: Her milisaniyenin önemli olduğu gerçek zamanlı uygulamalar için YOLOv9t, uç cihazlar için uygun olan inanılmaz hızlar (T4 TensorRT 2,3 ms) sunar.
  • Doğruluk:YOLOv9e, algılama doğruluğunun sınırlarını zorlayarak %55,6 mAP ulaşır ve yüksek hassasiyet gerektiren görevlerde üstünlük sağlar.

Ultralytics Ekosisteminin Avantajı

YOLOv7 YOLOv9 seçmiş olsanız da, Ultralytics Python aracılığıyla bunları kullanmak size birleşik ve kolaylaştırılmış bir deneyim sunar.

Kullanım Kolaylığı ve Eğitim

Ultralytics , ham PyTorch bulunan karmaşık eğitim döngülerini Ultralytics . Geliştiriciler, tek bir dize argümanını değiştirerek mimariler arasında geçiş yapabilir, böylece hiperparametre ayarlamasını ve denemeleri basitleştirebilir.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model (or substitute with "yolov7.pt")
model = YOLO("yolov9c.pt")

# Train on the COCO8 dataset with efficient memory management
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Bellek ve Kaynak Yönetimi

Ultralytics önemli bir avantajı, optimize edilmiş bellek kullanımıdır. Birçok Transformer tabanlı modelden (DETR varyantları gibi) veya eski iki aşamalı dedektörlerden farklı olarak, Ultralytics YOLO CUDA ani artışlarını en aza indirecek şekilde tasarlanmıştır. Bu, araştırmacıların tüketici sınıfı GPU'larda daha büyük parti boyutları kullanmasına olanak tanıyarak, üst düzey model eğitimine erişimi demokratikleştirir.

Entegre Veri Kümesi Yönetimi

Ultralytics , veri seti indirme ve biçimlendirme işlemlerini otomatik olarak Ultralytics . Aşağıdaki gibi standart veri setleriyle hemen eğitime başlayabilirsiniz COCO8 veya Objects365 gibi standart veri kümeleriyle hemen eğitime başlayabilirsiniz.

Gerçek Dünya Uygulamaları

YOLOv7 Ne Zaman Tercih Edilmeli?

YOLOv7 , eski sürümlerle uyumluluğun önemli olduğu sistemler için YOLOv7 sağlam bir seçimdir.

  • Oluşturulmuş Boru Hatları: 2022 dönemi C++ dışa aktarım boru hatlarıyla zaten entegre edilmiş projeler, YOLOv7 kullanmaya devam etmeyi daha kolay bulabilir.
  • Genel Amaçlı Algılama: Mutlak en düşük parametre sayısı birincil kısıtlama olmayan standart video analitiği için YOLOv7 takdire şayan bir performans sergiliyor.

YOLOv9 Ne Zaman Tercih Edilmeli?

YOLOv9 , üstün parametre verimliliği nedeniyle genellikle yeni dağıtımlar için YOLOv9 .

  • Edge Computing: GELAN'ın hafif yapısı, YOLOv9 depolama ve hesaplama kapasitesinin sınırlı olduğu gömülü sistemler ve mobil uygulamalar için YOLOv9 getirir.
  • Tıbbi Görüntüleme: PGI mimarisi, tıbbi taramalarda küçük anomalileri tespit ederken kritik öneme sahip olan ayrıntılı bilgilerin korunmasına yardımcı olur.
  • Hava Gözetimi: Geliştirilmiş özellik koruma özelliği, yüksek irtifadan çekilen drone görüntülerinden araçlar veya çiftlik hayvanları gibi küçük nesneleri tespit etmeye yardımcı olur.

Yeni Nesil: YOLO26

YOLOv7 YOLOv9 mükemmel modeller YOLOv9 da, yapay zeka alanı daha da fazla basitlik ve hız yönünde ilerlemektedir. Ultralytics Ocak 2026'da Ultralytics en son sürümü YOLO26 ile tanışın.

YOLO26, uçtan uca NMS tasarımıyla bir paradigma değişikliğini temsil ediyor. Non-Maximum Suppression (NMS) özelliğini kaldırarak, YOLO26 çıkarım boru hatlarındaki önemli bir darboğazı ortadan kaldırıyor ve dağıtımı basitleştiriyor. TensorRT ve ONNX dağıtımı basitleştirir.

  • MuSGD Optimizer: LLM eğitimindeki yeniliklerden (Moonshot AI'nın Kimi K2 gibi) esinlenen YOLO26, daha hızlı yakınsama ve daha fazla kararlılık için MuSGD optimizer'ı kullanır.
  • Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) ve ProgLoss + STAL gibi optimize edilmiş kayıp fonksiyonlarının kaldırılmasıyla YOLO26, CPU'larda %43'e kadar daha hızlı çalışır ve bu da onu kenar AI için en iyi seçim haline getirir.
  • Çok yönlülük: Algılama özel önceki modellerin aksine, YOLO26 doğal olarak poz tahmini, segmentasyon ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) destekler.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

Hem YOLOv7 YOLOv9 , bilgisayar görüşünün gelişmesine önemli katkılarda YOLOv9 . YOLOv7 , 2022 yılında hız ve doğruluk açısından yüksek bir çıta YOLOv7 , YOLOv9 ise 2024 yılında gradyan akışını ve parametre verimliliğini iyileştirmek için yeni mimari değişiklikler YOLOv9 .

Günümüzün geliştiricileri için tercih genellikle YOLOv9 'nin verimliliği veya NMS mimarisi ve CPU nedeniyle son teknoloji YOLO26 'dır. Güçlü Ultralytics tarafından desteklenen bu modeller arasında geçiş yaparak, akıllı şehir izleme veya tarımsal robotikgibi özel kısıtlamalarınıza en uygun modeli bulmak hiç bu kadar kolay olmamıştı.


Yorumlar