Nesne Algılamanın Evrimi: YOLOv5 ve YOLOv7

Bilgisayarlı görü dünyası, daha hızlı ve daha doğru gerçek zamanlı nesne algılama ihtiyacıyla son birkaç yılda hızla evrildi. Bilgisayarlı görü projen için doğru mimariyi seçerken, Ultralytics YOLOv5 ve YOLOv7 gibi popüler modeller arasındaki nüansları anlamak çok önemlidir. Bu kapsamlı teknik karşılaştırma, bilinçli bir karar vermene yardımcı olmak için mimarilerini, eğitim metodolojilerini, performans metriklerini ve ideal dağıtım senaryolarını inceliyor.

Bir Bakışta: Model Kökenleri

Bu modellerin arkasındaki kökenleri ve tasarım felsefelerini anlamak, mimari seçimleri için bağlam sağlar.

YOLOv5 Detayları:

YOLOv5 hakkında daha fazla bilgi edin

YOLOv7 Detayları:

YOLOv7 hakkında daha fazla bilgi edinin

Diğer Mimarileri Keşfet

Bu modellerin diğerlerine kıyasla nasıl performans gösterdiğini merak mı ediyorsun? Nesne algılama ekosistemi hakkındaki anlayışını genişletmek için YOLOv5 vs YOLO11 veya YOLOv7 vs EfficientDet gibi karşılaştırmalarımıza göz at.

Mimari Yenilikler ve Farklılıklar

YOLOv5: Erişilebilirlik Standardı

2020 yılında Ultralytics tarafından tanıtılan YOLOv5, PyTorch çerçevesini yerel olarak kullanarak bir paradigma değişimi yarattı ve araştırmacılar ile geliştiriciler için giriş engelini önemli ölçüde düşürdü. Mimarisi, parametre sayısını azaltırken gradyan akışını korumak için Çapraz Aşama Kısmi (CSP) ağlarını entegre eden Değiştirilmiş CSPDarknet53 omurgasına dayanır.

En büyük güçlü yönlerinden biri Bellek gereksinimleridir. Eski iki aşamalı dedektörlere veya RT-DETR gibi ağır transformer modellerine kıyasla, YOLOv5 eğitim sırasında çok daha az CUDA belleği gerektirir ve bu da standart tüketici sınıfı GPU'larda daha büyük yığın boyutlarına olanak tanır. Ayrıca, yerel olarak entegre edilmiş Çok Yönlülüğü, görüntü sınıflandırma, nesne algılama ve görüntü bölütleme işlemlerini sorunsuz bir şekilde destekler.

YOLOv7: Gerçek Zamanlı Doğruluğun Sınırlarını Zorlamak

2022 ortasında piyasaya sürülen YOLOv7, MS COCO kıyaslamalarında gerçek zamanlı algılama için son teknolojinin sınırlarını zorlamaya odaklandı. Yazarlar, orijinal gradyan yolunu bozmadan ağın öğrenme yeteneğini geliştiren Genişletilmiş Verimli Katman Birleştirme Ağını (E-ELAN) tanıttılar.

YOLOv7 ayrıca, özellikle eğitim sırasında birden fazla modülü çıkarım için tek bir evrişimli katmana dönüştüren ve doğruluğu düşürmeden hızı artıran yeniden parametreleştirme teknikleri olan "eğitilebilir bag-of-freebies" özelliğiyle ünlüdür. Ancak, bu karmaşık eğitim metodolojisi, yerel Ultralytics ekosistemine kıyasla genellikle daha dik öğrenme eğrilerine ve daha az anlaşılır dışa aktarma hatlarına yol açar.

Performans Karşılaştırması

Bu modelleri değerlendirirken, hız, doğruluk ve hesaplama maliyeti arasındaki Performans Dengesi çok önemlidir. Aşağıda, MS COCO val2017 veri kümesine dayalı performans metriklerinin ayrıntılı bir karşılaştırması yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

YOLOv7, daha büyük varyantlarda daha yüksek mutlak mAP puanları elde ederken, YOLOv5, aşırı uç cihazlar için ultra hafif Nano'dan (YOLOv5n) bulut çıkarımı için Ekstra Büyük (YOLOv5x) modele kadar benzersiz bir model yelpazesi sunar.

Ultralytics Ekosistem Avantajı

Bir modelin faydası, yalnızca ham mimarisinin ötesine geçer; onu çevreleyen ekosistem, üretime ne kadar hızlı dağıtılabileceğini belirler. Ultralytics modellerinin parladığı yer burasıdır.

  • Kullanım Kolaylığı: Ultralytics Platformu ve birleştirilmiş Python API'si, akıcı bir kullanıcı deneyimi, basit bir söz dizimi ve kapsamlı dokümantasyon sağlar. Özel bir veri kümesini eğitmek sıfır boilerplate kodu gerektirir.
  • İyi Korunan Ekosistem: Ultralytics, aktif geliştirme, sık güncellemeler ve güçlü topluluk desteğinden yararlanır. Comet ML ve Weights & Biases gibi araçlarla entegrasyonlar doğrudan içinde mevcuttur.
  • Eğitim Verimliliği: Veri yükleyiciler, akıllı önbelleğe alma ve çoklu GPU desteği, Ultralytics modellerinin eğitilmesini son derece verimli hale getirir. Hazır önceden eğitilmiş ağırlıklar, transfer öğrenmeyi önemli ölçüde hızlandırır.

Kod Örneği: Başlangıç

Ultralytics kullanarak bir modeli dağıtmak sadece birkaç satır kod gerektirir. Aşağıdaki Python kod parçacığı, önerilen ultralytics paketini kullanarak yüklemenin, eğitmenin ve çıkarım çalıştırmanın ne kadar basit olduğunu gösterir.

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

Buna karşılık, orijinal YOLOv7 deposunu kullanmak genellikle karmaşık depoları klonlamayı, bağımlılıkları manuel olarak yönetmeyi ve uzun komut satırı argümanları kullanmayı gerektirir.

Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları

Ne Zaman YOLOv7 Seçilmeli

YOLOv7, maksimum mAP'nin tek hedef olduğu ve sistemin zaten çapaya dayalı çıktı tensörlerine göre uyarlandığı akademik kıyaslamalar veya belirli eski GPU hatları için güçlü bir aday olmaya devam ediyor. Gradyan yolu analizi yapan araştırmacılar genellikle YOLOv7'yi temel model olarak kullanırlar.

Ne Zaman YOLOv5 Seçilmeli

YOLOv5, olağanüstü kararlılığı nedeniyle üretim ortamlarında büyük ölçüde tercih edilir. Aşağıdaki durumlar için tercih edilen bir seçimdir:

  • Mobil ve Uç Bilişim: CoreML aracılığıyla iOS'a veya TFLite aracılığıyla Android'e YOLOv5n dağıtımı.
  • Çevik Girişimler: Hızlı yineleme döngülerine ihtiyaç duyan ekipler, veri kümesi yönetimi ve bulut eğitimi için sorunsuz Ultralytics Platformu entegrasyonundan yararlanır.
  • Çok Görevli Ortamlar: Eşzamanlı nesne algılama, sınıflandırma ve bölütleme gerektiren sistemler.

Gelecek: YOLO26'ya Geçiş

YOLOv5 ve YOLOv7'yi karşılaştırmak, görme yapay zekasının evrimini anlamak için harika bir alıştırma olsa da, teknoloji ilerlemeye devam etti. Ocak 2026'da yayınlanan Ultralytics YOLO26, anıtsal bir ileri atılımı temsil ederek eski mimarileri yeni projeler için büyük ölçüde geçersiz kılıyor.

Performansın zirvesini arayan geliştiriciler için YOLO26, hem YOLOv5 hem de YOLOv7'ye göre birçok çığır açan avantaj sunar:

  • Uçtan Uca NMS-Olmayan Tasarım: Maksimum Olmayan Bastırma (NMS) sonrası işlemini ortadan kaldıran YOLO26, çok daha basit dağıtım ve daha hızlı, tutarlı gecikme süreleri sunar.
  • MuSGD Optimize Edici: Moonshot AI'dan gelen LLM inovasyonlarından ilham alan bu hibrit optimize edici, son derece kararlı eğitim ve hızlı yakınsama sağlar.
  • Eşi Görülmemiş Uç Hızı: Uç ortamlar için özel olarak optimize edilen nano varyant, Dağılım Odak Kaybını (DFL) kaldırarak %43'e kadar daha hızlı CPU çıkarımı sağlar.
  • Üstün Doğruluk: ProgLoss + STAL gibi yeni kayıp fonksiyonları, küçük nesne tanımasını önemli ölçüde iyileştirerek onu drone görüntüleri ve robotik için ideal hale getirir.

İster mevcut bir YOLOv5 hattını koruyor olun, ister en ileri teknoloji ürünü YOLO26'yı uygulamak istiyor olun, Ultralytics Platformu modern bilgisayarlı görüde başarılı olmak için gereken tüm araçları sağlar.

Yorumlar