İçeriğe geç

YOLOv5 vs YOLOv7: Ekosistem ve Mimarinin Dengelenmesi

Doğru nesne algılama modelini seçmek, hem geliştiriciler hem de araştırmacılar için kritik bir karardır. YOLO (You Only Look Once) ailesinin evriminde, YOLOv5 ve YOLOv7bilgisayarla görme alanını şekillendiren önemli mimariler olarak öne çıkmaktadır. YOLOv7 doğruluk için önemli mimari yenilikler getirirken, Ultralytics YOLOv5 kullanılabilirlik, dağıtım ve sağlam bir ekosisteme odaklanarak geliştirici deneyiminde devrim yarattı.

Bu kılavuz, bu iki modelin mimarilerini, COCO veri kümesindeki performans ölçümlerini ve gerçek dünya uygulamaları için uygunluklarını analiz ederek derinlemesine bir teknik karşılaştırma sunmaktadır.

Ultralytics YOLOv5: Mühendislik Standardı

2020 yılında piyasaya sürülen YOLOv5 , açık kaynaklı nesne algılama yazılımına yönelik beklentileri yeniden tanımladı. Öncelikle araştırma kodu olarak var olan önceki yinelemelerin aksine, YOLOv5 ürüne hazır bir çerçeve olarak tasarlandı. Kullanım kolaylığı, dışa aktarılabilirlik ve hıza öncelik vererek gerçek zamanlı çıkarım uygulamaları geliştiren şirketlerin tercihi haline geldi.

Yazarlar: Glenn Jocher
Organizasyon:Ultralytics
Tarih: 2020-06-26
GitHubyolov5
Docsyolov5yolov5

YOLOv5'in Temel Avantajları

  • Kullanıcı Merkezli Tasarım: YOLOv5 , özel nesne algılama modellerinin eğitimi için giriş engelini azaltan kolaylaştırılmış bir API ve sorunsuz bir eğitim iş akışı sundu.
  • Dağıtım Esnekliği: Dışa aktarma modları için yerel destek ile YOLOv5 modelleri aşağıdaki gibi formatlara kolayca dönüştürülebilir ONNX, CoreML, TFLite ve TensorRT farklı donanımlarda dağıtım için.
  • Verimli Kaynak Kullanımı: Mimari, düşük bellek tüketimi için optimize edilmiştir, bu da onu NVIDIA Jetson veya Raspberry Pi gibi uç yapay zeka cihazları için ideal hale getirir.

Ekosistem Desteği

YOLOv5 , kapsamlı Ultralytics ekosistemi tarafından desteklenmektedir. Bu, aşağıdaki gibi deney izleme araçlarıyla sorunsuz entegrasyonu içerir Comet ve MLflow'un yanı sıra veri kümesi yönetim platformları.

YOLOv5 hakkında daha fazla bilgi edinin

YOLOv7: "Bedava Çanta" Yaklaşımı

2022 yılında yayınlanan YOLOv7 , mimari optimizasyon yoluyla doğruluk sınırlarını zorlamaya büyük ölçüde odaklanmıştır. Yazarlar, çıkarım maliyetini artırmadan özellik öğrenmeyi iyileştirmeyi amaçlayan ve "eğitilebilir ücretsiz torba" olarak adlandırdıkları bir strateji olan çeşitli yeni kavramları tanıttılar.

Yazarlar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Organizasyon: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics

Mimari Yenilikler

YOLOv7 , ağın öğrenme kapasitesini artırmak için Genişletilmiş Verimli Katman Toplama Ağlarını (E-ELAN) içerir. Ayrıca mimarinin derinliğini ve genişliğini aynı anda değiştiren model ölçeklendirme tekniklerini de kullanır. mAP puanlarını yükseltmek için etkili olsa da, bu karmaşık mimari değişiklikler bazen YOLOv5'te bulunan daha basit CSP-Darknet backbone kıyasla modeli değiştirmeyi veya dağıtmayı zorlaştırabilir.

YOLOv7 hakkında daha fazla bilgi edinin

Teknik Performans Karşılaştırması

İki modeli karşılaştırırken, genellikle ham doğruluk ve pratik dağıtım hızı arasında bir denge söz konusudur. YOLOv7 modelleri (özellikle daha büyük varyantlar) COCO val2017 veri setinde genellikle daha yüksek mAP elde eder. Bununla birlikte, Ultralytics YOLOv5 , özellikle mobil dağıtım için çok önemli olan daha küçük varyantları (Nano ve Small) ile çıkarım hızı ve parametre verimliliğinde üstünlüğünü korumaktadır.

Aşağıdaki tablo performans ölçümlerini vurgulamaktadır. Son derece kısıtlı kaynaklara sahip ortamlar için en hızlı seçeneklerden biri olmaya devam eden YOLOv5n'in olağanüstü hızına dikkat edin.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Metriklerin Analizi

  • Hız ve Doğruluk: YOLOv7x %53,1'lik daha yüksek bir mAP elde ederek her pikselin önemli olduğu üst düzey güvenlik veya tıbbi analizler için uygun hale gelir. Ancak video analizi veya otonom navigasyon gibi uygulamalar için YOLOv5n'in TensorRT üzerindeki 1,12 ms' lik çıkarım süresi, daha ağır modellerin karşılayamayacağı bir kare hızı kapasitesi sunar.
  • Eğitim Verimliliği: Ultralytics YOLOv5 , YOLOv7'nin gerektirdiği karmaşık yeniden parametrelendirme şemalarına kıyasla eğitim sırasında genellikle daha hızlı yakınsama ile sonuçlanan "AutoAnchor" stratejilerini ve gelişmiş hiperparametre evrimini kullanır.
  • Bellek Ayak İzi: Transformatörleri veya YOLOv7 gibi karmaşık mimarileri eğitmek için genellikle üst düzey GPU'lar (ör. A100'ler) gerekir. Buna karşılık, YOLOv5'in verimli tasarımı, tüketici sınıfı donanımlarda eğitime olanak tanıyarak yapay zeka geliştirmeye erişimi demokratikleştirir.

Kod Uygulaması

Ultralytics YOLOv5 için en güçlü argümanlardan biri Python API'sinin basitliğidir. Önceden eğitilmiş bir modeli yüklemek ve çıkarımı çalıştırmak, çerçevenin olgunluğunun bir kanıtı olarak yalnızca birkaç satır kod gerektirir.

import torch

# Load the YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image (url, local path, or numpy array)
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results and show the image with bounding boxes
results.print()
results.show()

Bu soyutlama seviyesi, geliştiricilerin model mimarilerinde hata ayıklamak yerine iş çözümlerini oluşturmaya odaklanmalarını sağlar.

İdeal Kullanım Senaryoları

YOLOv7 Ne Zaman Seçilmeli

YOLOv7 , akademik araştırmalar ve donanım kısıtlamalarının ham algılama performansına göre ikincil olduğu senaryolar için mükemmel bir seçimdir.

  • Akademik Araştırma: Son teknoloji tespit tekniklerini kıyaslamak için.
  • Yüksek Hassasiyetli Denetim: Küçük kusurları tespit etmenin kritik olduğu ve gecikmenin daha az endişe kaynağı olduğu üretim kalite kontrolü gibi.

Ultralytics YOLOv5 Ne Zaman Seçilmeli

YOLOv5 , hızlı geliştirme ve üretim dağıtımı için endüstri standardı olmaya devam etmektedir.

  • Edge Dağıtımı: TFLite veya CoreML dışa aktarımları yoluyla iOS ve Android cihazlarda çalıştırmak için mükemmeldir.
  • Robotik: Düşük gecikme süresi, otonom robotikte gerekli olan geri bildirim döngüleri için çok önemlidir.
  • Çok yönlülük: Algılamanın ötesinde, YOLOv5 deposu örnek segmentasyonunu ve görüntü sınıflandırmasını destekleyerek birden fazla görme görevi için birleşik bir kod tabanı sağlar.

Sonuç: İleriye Doğru Modern Yol

YOLOv7 ise mimari ayarlamanın gücünü ortaya koymuştur, Ultralytics YOLOv5 güvenilir, iyi belgelenmiş ve dağıtımı kolay bir çözüme ihtiyaç duyan geliştiriciler için üstün bir seçim olmaya devam ediyor. Hız, doğruluk ve ekosistem desteği dengesi, dünya çapındaki üretim ortamlarında geçerliliğini korumasını sağlar.

Ancak, bilgisayarla görme alanı hızla ilerlemektedir. Mutlak en iyi performansı arayanlar için, YOLO11Ultralytics'in en son evrimini temsil etmektedir. YOLO11 , YOLOv5 'in kullanılabilirliği üzerine inşa edilmiştir, ancak son teknoloji transformatör tabanlı modüller ve çapasız tasarımlar içerir ve hem YOLOv5 hem de YOLOv7 'yi doğruluk ve verimlilik açısından aşar.

Nesne Algılama, Poz Tahmini ve Yönlendirilmiş Sınırlama Kutularını (OBB) destekleyen geleceğe dönük bir çözüm için Ultralytics YOLO11 çerçevesine geçilmesi şiddetle tavsiye edilir.

Daha Fazla Karşılaştırma Keşfedin

Diğer modellerin Ultralytics YOLO ailesi karşısında nasıl durduğunu keşfedin:


Yorumlar