İçeriğe geç

YOLOv7 ve YOLOv5: Gerçek Zamanlı Dedektörlerin Teknik Karşılaştırması

Modern bilgisayar görüşü işlem hatları oluştururken, doğruluk, çıkarım hızı ve kaynak kullanımını dengelemek için doğru nesne algılama mimarisini seçmek kritik öneme sahiptir. Bu kapsamlı karşılaştırma, bilgisayar görüşü alanındaki iki oldukça etkili modeli inceler: YOLOv7 ve Ultralytics YOLOv5.

Mimari farklılıklarını, performans metriklerini ve ideal dağıtım senaryolarını analiz ederek, geliştiricilere ve araştırmacılara belirli gereksinimleri için en iyi modeli seçmelerinde yardımcı olmayı amaçlıyoruz.

Modelin Arka Planı ve Kökenleri

Bu modellerin kökenlerini anlamak, tasarım felsefeleri ve hedeflenen kullanım durumları için bağlam sağlar.

YOLOv5

26 Haziran 2020'de Glenn Jocher ve Ultralytics ekibi tarafından yayınlanan YOLOv5, performanstan ödün vermeden kullanılabilirliği ön planda tutan yerel bir PyTorch uygulaması sunarak alanı devrim niteliğinde değiştirdi. İnanılmaz derecede kolaylaştırılmış ekosistemi ve güvenilir eğitim dinamikleri sayesinde hızla bir endüstri standardı haline geldi. Kaynak kodunu YOLOv5 GitHub deposunda inceleyebilir veya modele doğrudan Ultralytics Platformu aracılığıyla erişebilirsiniz.

YOLOv5 hakkında daha fazla bilgi edinin.

YOLOv7

6 Temmuz 2022'de Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından tanıtıldı. YOLOv7, doğrulukta son teknolojiyi zorlamak için Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN) ve eğitilebilir bir "bag-of-freebies" gibi mimari yeniliklere yoğunlaştı. Detaylar, resmi Arxiv makalelerinde ve YOLOv7 GitHub deposunda bulunabilir. Sorunsuz entegrasyon için Ultralytics YOLOv7 dokümantasyonuna göz atın.

YOLOv7 hakkında daha fazla bilgi edinin.

Sorunsuz Deneyler

Bu modellerin her ikisi de Ultralytics Python paketine tamamen entegre edilmiştir ve kodunuzdaki model dizesini değiştirerek aralarında geçiş yapmanıza olanak tanır!

Mimari Yenilikler

Ultralytics YOLOv5 Tasarımı

YOLOv5, değiştirilmiş bir CSPDarknet53 backbone'unu bir Yol Toplama Ağı (PANet) boynu ile birlikte kullanır. Bu tasarım, hızlı özellik çıkarımı ve bellek verimliliği için yüksek düzeyde optimize edilmiştir. Eski mimarilerin veya ağır transformatör modellerinin aksine, YOLOv5 eğitim sırasında önemli ölçüde daha az CUDA belleği gerektirir ve standart tüketici sınıfı GPU'larda daha büyük toplu iş boyutlarına olanak tanır. Ayrıca, Ultralytics çerçevesi, standart sınırlayıcı kutuların ötesinde görüntü segmentasyonu ve görüntü sınıflandırması dahil olmak üzere çok çeşitli görevleri doğal olarak destekler.

YOLOv7 Tasarımı

YOLOv7, ağın orijinal gradyan yolunu bozmadan daha çeşitli özellikler öğrenmesini sağlayan çeşitli yapısal yeniden parametrelendirmeler ve E-ELAN mimarisini tanıttı. Ayrıca, eğitim sırasında ara denetim için yardımcı bir başlık uygular. Bu gelişmeler yüksek ortalama Hassasiyet (mAP) sağlarken, genellikle ONNX veya TensorRT gibi uç formatlara dışa aktarmayı, Ultralytics modellerine özgü kolaylaştırılmış dışa aktarmalara kıyasla biraz daha zorlaştırabilen karmaşık tensor yapıları sunarlar.

Performans Analizi

Bu modelleri karşılaştırırken, geliştiricilerin mAPval, çıkarım hızı ve hesaplama karmaşıklığı (FLOPs) arasında denge kurması gerekir. Aşağıdaki tablo, her iki mimarinin COCO veri kümesi üzerinde değerlendirilen performansını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Temel Çıkarımlar

  • Doğruluk Tavanı: YOLOv7x, etkileyici bir 53.1 mAPval ile en yüksek genel doğruluğu elde ederek, algılama performansını maksimize etmenin birincil hedef olduğu senaryolar için oldukça rekabetçi bir çözüm sunar.
  • Hız ve Verimlilik: Ultralytics YOLOv5n, sadece 2.6M parametrelik küçük bir bellek ayak izi ile yıldırım hızında çıkarım gecikmesi (T4 TensorRT üzerinde 1.12 ms) sunan bir verimlilik harikasıdır. Bu, onu yüksek kısıtlamalı uç dağıtımlar için eşsiz bir seçenek haline getirir.
  • Performans Dengesi: YOLOv5 serisi, olağanüstü bir model yelpazesi sunar. YOLOv5l, YOLOv7l'nin küçük bir doğruluk farkıyla gerisinde kalırken, oldukça olgun bir dağıtım işlem hattı sunarak harika bir orta yol sağlar.

Ultralytics Ekosisteminin Avantajı

Bir modelin mimarisi denklemin sadece yarısıdır; onu çevreleyen ekosistem, gerçek dünyadaki uygulanabilirliğini belirler. Ultralytics modelleri işte burada gerçekten parlar.

Kullanım Kolaylığı: Ultralytics, birleşik, son derece sezgisel bir Python API'si sunar. Kapsamlı resmi dokümantasyon desteğiyle, minimum şablon kod ile modelleri eğitebilir, doğrulayabilir ve dağıtabilirsiniz. İyi Yönetilen Ekosistem: Aktif geliştirme, sürekli güncellemeler, hata düzeltmeleri ve Weights & Biases gibi modern izleme araçlarıyla sorunsuz entegrasyon sağlar. Eğitim Verimliliği: Optimize edilmiş veri yükleyicileri ve akıllı önbellekleme kullanarak, YOLOv5 eğitim sürelerini önemli ölçüde azaltır. Ayrıca, kullanıma hazır önceden eğitilmiş ağırlıklar, çeşitli alanlarda transfer öğrenimini hızlandırır.

Kod Örneği: Akıcı Eğitim

Ultralytics paketi ile, seçtiğiniz mimariden bağımsız olarak bir eğitim çalıştırması başlatmak neredeyse aynıdır.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

İdeal Kullanım Senaryoları

YOLOv7 Ne Zaman Tercih Edilmeli?

  • Akademik Kıyaslama: Yeni teknikleri iyi belgelenmiş 2022 taban çizgisine karşı karşılaştırması gereken araştırmacılar için mükemmeldir.
  • Üst Düzey GPU Bulut İşleme: Yoğun sahnelerde mutlak en yüksek mAP değerine ulaşmanın, dışa aktarım basitliğinden daha önemli olduğu güçlü sunucu donanımlarında dağıtım yaparken.

YOLOv5 Ne Zaman Tercih Edilmeli?

  • Üretim Dağıtımları: Yüksek kararlılık, basit model dağıtım seçenekleri ve geniş çapraz platform uyumluluğu gerektiren ticari uygulamalar için idealdir.
  • Uç Cihazlar: Daha küçük varyantlar (YOLOv5n ve YOLOv5s) cep telefonlarında ve gömülü sistemlerde olağanüstü iyi çalışır.
  • Çoklu Görev Gereksinimleri: Projenizin basit detect işleminden, birleşik bir çerçeve kullanarak poz tahmini veya segmentasyona evrilmesi gerekiyorsa.

Diğer Mimarileri Keşfetmek

Daha yeni iterasyonlar mı arıyorsunuz? Çapasız detect ve çoklu görev öğrenme yeteneklerindeki daha fazla gelişme için Ultralytics YOLOv8 veya Ultralytics YOLO11'i keşfetmeyi düşünebilirsiniz.

Yeni Nesil: Ultralytics YOLO26

YOLOv5 ve YOLOv7, görme yapay zekası tarihinde önemli yerlere sahip olsa da, alan sürekli gelişmektedir. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, nesne detect teknolojisinin mutlak son noktasını temsil etmekte ve tüm metriklerde önceki nesilleri geride bırakmaktadır.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, paradigma değiştiren çeşitli özellikler sunmaktadır:

  • Uçtan Uca NMS'siz Tasarım: Önceki iterasyonlarda öncülük edilen konseptler üzerine inşa edilen YOLO26, doğal olarak uçtan ucadır. Bu, Non-Maximum Suppression (NMS) son işleme adımını tamamen ortadan kaldırarak gecikme darboğazlarını azaltır ve dağıtım mantığını büyük ölçüde basitleştirir.
  • MuSGD Optimizasyonu: Moonshot AI'nin Kimi K2'sinden ilham alan bu devrim niteliğindeki optimize edici, standart SGD'nin kararlılığını Muon'un hızlandırılmış momentumuyla birleştirerek, gelişmiş LLM eğitim yeniliklerini doğrudan bilgisayar görüşüne taşır.
  • Geliştirilmiş CPU Hızı: Distribution Focal Loss (DFL) stratejik olarak kaldırılarak, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder ve bu da onu uç ve düşük güçlü IoT cihaz dağıtımı için tartışmasız şampiyon yapar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada büyük iyileşmeler sağlar; bu da hava görüntüleme ve hassas robotik için kritik öneme sahiptir.
  • Göreve Özel İyileştirmeler: Maske üretimi için Semantik segmentasyon kaybı, Poz track için Residual Log-Likelihood Estimation (RLE) ve zorlu Oriented Bounding Box (OBB) sınır sorunlarını çözmek için özel açı kaybı içerir.

Sonuç

Hem YOLOv5 hem de YOLOv7, gerçek zamanlı nesne detect için sağlam çözümler sunar. YOLOv7, yüksek hesaplama gücüne sahip donanımlarda ham doğruluk için güçlü bir seçenek olmaya devam ederken, YOLOv5 ise hız, verimlilik ve birinci sınıf bir ekosistemin olağanüstü dengesini sunan, geliştirici dostu nihai araç olarak öne çıkmaktadır.

Ancak, iş akışlarını geleceğe hazır hale getirmek ve hız, basitlik ve son teknoloji doğruluğun nihai kombinasyonunu elde etmek isteyen geliştiriciler için, Ultralytics YOLO26'ya geçiş yapmalarını şiddetle tavsiye ederiz. Bu, Ultralytics platformunun efsanevi kullanım kolaylığını bünyesinde barındırırken çığır açan mimari yenilikler sunmaktadır.


Yorumlar