İçeriğe geç

Nesne Algılamanın Evrimi: YOLOv5 ve YOLOv7

Bilgisayar görüşü alanı, daha hızlı ve daha doğru gerçek zamanlı nesne algılama ihtiyacıyla son birkaç yılda hızla gelişti. Bilgisayar görüşü projeniz için doğru mimariyi seçerken, Ultralytics YOLOv5 ve YOLOv7 gibi popüler modeller arasındaki nüansları anlamak çok önemlidir. Bu kapsamlı teknik karşılaştırma, bilinçli bir karar vermenize yardımcı olmak için bu modellerin mimarilerini, eğitim metodolojilerini, performans metriklerini ve ideal dağıtım senaryolarını derinlemesine inceler.

Bir Bakışta: Model Kökenleri

Bu modellerin kökenlerini ve tasarım felsefelerini anlamak, mimari seçimleri için bir bağlam sağlar.

YOLOv5 Detayları:

YOLOv5 hakkında daha fazla bilgi edinin.

YOLOv7 Detayları:

YOLOv7 hakkında daha fazla bilgi edinin.

Daha Fazla Mimariyi Keşfedin

Bu modellerin diğerlerine karşı nasıl performans gösterdiğini merak mı ediyorsunuz? Nesne algılama ekosistemi hakkındaki anlayışınızı genişletmek için YOLOv5 vs YOLO11 veya YOLOv7 vs EfficientDet gibi karşılaştırmalarımıza göz atın.

Mimari Yenilikler ve Farklılıklar

YOLOv5: Erişilebilirlik Standardı

2020'de Ultralytics tarafından tanıtılan YOLOv5, PyTorch çerçevesini doğal olarak kullanarak bir paradigma değişimi getirdi ve araştırmacılar ile geliştiriciler için giriş engelini önemli ölçüde düşürdü. Mimarisi, gradyan akışını korurken parametre sayısını azaltmak için Çapraz Aşama Kısmi (CSP) ağlarını entegre eden Modifiye CSPDarknet53 backbone'una dayanır.

En büyük güçlerinden biri Bellek gereksinimleridir. Eski iki aşamalı dedektörlere veya RT-DETR gibi ağır transformer modellerine kıyasla, YOLOv5 eğitim sırasında önemli ölçüde daha az CUDA belleği gerektirir, bu da standart tüketici sınıfı GPU'larda daha büyük toplu iş boyutlarına olanak tanır. Ayrıca, doğal olarak entegre Çok Yönlülüğü, görüntü sınıflandırma, nesne algılama ve görüntü segmentasyonu işlemlerini sorunsuz bir şekilde destekler.

YOLOv7: Gerçek Zamanlı Doğruluk Sınırlarını Zorlamak

2022 ortalarında piyasaya sürülen YOLOv7, MS COCO kıyaslamalarında gerçek zamanlı algılama için en son teknoloji sınırlarını zorlamaya odaklandı. Yazarlar, orijinal gradyan yolunu bozmadan ağın öğrenme yeteneğini geliştiren Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) 'nı tanıttı.

YOLOv7, özellikle eğitim sırasında birden fazla modülü çıkarım için tek bir evrişimsel katmana dönüştüren, doğruluğu feda etmeden hızı artıran yeniden parametrelendirme teknikleri sayesinde "eğitilebilir bedavalar çantası" ile de ünlüdür. Ancak, bu karmaşık eğitim metodolojisi, yerel Ultralytics ekosistemine kıyasla genellikle daha dik öğrenme eğrileri ve daha az anlaşılır dışa aktarma işlem hatları ile sonuçlanır.

Performans Karşılaştırması

Bu modelleri değerlendirirken, hız, doğruluk ve hesaplama maliyeti arasındaki Performans Dengesi çok önemlidir. Aşağıda, MS COCO val2017 veri kümesine dayalı performans metriklerinin ayrıntılı bir karşılaştırması bulunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

YOLOv7 daha büyük varyantlarda daha yüksek mutlak mAP puanları elde ederken, YOLOv5, aşırı uç cihazlar için ultra hafif Nano (YOLOv5n) 'dan bulut çıkarımı için Ekstra Büyük (YOLOv5x) 'e kadar eşsiz bir model yelpazesi sunar.

Ultralytics Ekosisteminin Avantajı

Bir modelin kullanışlılığı, ham mimarisinin ötesine geçer; onu çevreleyen ekosistem, üretime ne kadar hızlı dağıtılabileceğini belirler.

  • Kullanım Kolaylığı: Ultralytics Platformu ve birleşik Python API'si, kolaylaştırılmış bir kullanıcı deneyimi, basit sözdizimi ve kapsamlı dokümantasyon sağlar. Özel bir veri kümesini eğitmek sıfır şablon kodu gerektirir.
  • İyi Yönetilen Ekosistem: Ultralytics, aktif geliştirme, sık güncellemeler ve güçlü topluluk desteğinden faydalanır. Comet ML ve Weights & Biases gibi araçlarla entegrasyonlar doğrudan yerleşiktir.
  • Eğitim Verimliliği: Veri yükleyiciler, akıllı önbellekleme ve çoklu GPU desteği, Ultralytics modellerini eğitim için olağanüstü verimli hale getirir. Hazır bulunan önceden eğitilmiş ağırlıklar, transfer öğrenimini önemli ölçüde hızlandırır.

Kod Örneği: Başlarken

Ultralytics kullanarak, bir modeli dağıtmak yalnızca birkaç satır kod gerektirir. Aşağıdaki Python kod parçacığı, önerilen yöntemle bir modeli yüklemenin, eğitmenin ve çıkarım yapmanın ne kadar basit olduğunu göstermektedir. ultralytics paketi.

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

Buna karşılık, orijinal YOLOv7 deposunu kullanmak genellikle karmaşık depoları klonlamayı, bağımlılıkları manuel olarak yönetmeyi ve uzun komut satırı argümanlarını kullanmayı içerir.

Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları

YOLOv7 Ne Zaman Tercih Edilmeli?

YOLOv7, maksimum mAP'nin tek hedef olduğu ve sistemin zaten çapa tabanlı çıktı tensor'larına göre uyarlanmış olduğu akademik kıyaslama veya belirli eski GPU işlem hatları için güçlü bir aday olmaya devam etmektedir. Gradyan yolu analizini araştıran araştırmacılar genellikle YOLOv7'yi bir temel olarak kullanır.

YOLOv5 Ne Zaman Tercih Edilmeli?

YOLOv5, olağanüstü kararlılığı nedeniyle üretim ortamları için büyük ölçüde tercih edilmektedir. Aşağıdaki durumlar için ilk tercihtir:

  • Mobil ve Uç Bilişim: YOLOv5n'i CoreML aracılığıyla iOS'a veya TFLite aracılığıyla Android'e dağıtma.
  • Çevik Girişimler: Hızlı yineleme döngülerine ihtiyaç duyan ekipler, veri kümesi yönetimi ve bulut eğitimi için sorunsuz Ultralytics Platformu entegrasyonundan faydalanır.
  • Çok Görevli Ortamlar: Eş zamanlı nesne algılama, sınıflandırma ve segmentasyon gerektiren sistemler.

Gelecek: YOLO26'ya Geçiş

YOLOv5 ve YOLOv7'yi karşılaştırmak, yapay zeka vizyonunun evrimini anlamak için mükemmel bir çalışma olsa da, en son teknoloji ilerlemeye devam etti. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, yeni projeler için eski mimarileri büyük ölçüde eskimiş hale getirerek muazzam bir ilerlemeyi temsil ediyor.

Performansın zirvesini arayan geliştiriciler için YOLO26, hem YOLOv5 hem de YOLOv7'ye göre çığır açan birçok avantaj sunuyor:

  • Uçtan Uca NMS'siz Tasarım: Non-Maximum Suppression (NMS) son işlemeyi ortadan kaldırarak, YOLO26 önemli ölçüde daha basit dağıtım ve daha hızlı, tutarlı gecikme süresi sunar.
  • MuSGD Optimizatörü: Moonshot AI'dan gelen LLM yeniliklerinden esinlenilen bu hibrit optimizatör, oldukça kararlı eğitim ve hızlı yakınsama sağlar.
  • Eşi Benzeri Görülmemiş Uç Hız: Uç ortamlar için özel olarak optimize edilmiş nano varyantı, Distribution Focal Loss (DFL) kaldırılmasıyla %43'e kadar daha hızlı CPU çıkarımı sunar.
  • Üstün Doğruluk: ProgLoss + STAL gibi yeni kayıp fonksiyonları, küçük nesne tanımayı önemli ölçüde iyileştirerek drone görüntüleri ve robotik için ideal hale getirir.

Mevcut bir YOLOv5 hattını sürdürüyor veya en son teknoloji YOLO26'yı uygulamak istiyor olun, Ultralytics Platformu, modern bilgisayar görüşünde başarılı olmak için gerekli tüm araçları sağlar.


Yorumlar