YOLOv7 vs YOLOv5: Detaylı Teknik Karşılaştırma
Doğru nesne algılama mimarisini seçmek, bilgisayarla görme projelerinizin hızını, doğruluğunu ve dağıtım fizibilitesini etkileyen kritik bir karardır. Bu sayfa aşağıdakiler arasında kapsamlı bir teknik karşılaştırma sunmaktadır YOLOv7 ve Ultralytics YOLOv5YOLO serisinin iki etkili modeli. Uygulamanıza en uygun olanı seçmenize yardımcı olmak için mimari yeniliklerini, performans kıyaslamalarını ve ideal kullanım durumlarını inceliyoruz.
YOLOv7 2022'de önemli akademik ilerlemeler sunarken, Ultralytics YOLOv5 benzersiz kullanım kolaylığı, sağlamlığı ve dağıtım esnekliği sayesinde sektörde baskın bir güç olmaya devam ediyor. Performansta en son teknolojiyi arayanlar için, bu modellerin en son teknolojinin önünü nasıl açtığını da keşfediyoruz Ultralytics YOLO11.
Performans Metriklerinin Karşılaştırılması
Aşağıdaki tablo, iki mimari arasındaki performans dengelerini vurgulamaktadır. YOLOv7 daha yüksek Ortalama Hassasiyet (mAP) için zorlarken, YOLOv5 çıkarım hızında ve belirli model boyutları için daha düşük parametre sayılarında belirgin avantajlar sunar.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv7: Doğruluk Sınırlarını Zorluyor
Temmuz 2022'de piyasaya sürülen YOLOv7 , gerçek zamanlı nesne dedektörleri için yeni bir son teknoloji belirlemek üzere tasarlanmıştır. Çıkarım maliyetini önemli ölçüde artırmadan doğruluğu artırmak için büyük ölçüde mimari optimizasyona odaklanır.
Yazarlar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics
Mimari ve Temel Yenilikler
YOLOv7 , özellik öğrenmeyi iyileştirmeyi amaçlayan birkaç karmaşık mimari değişiklik getirmektedir:
- E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı): En kısa ve en uzun gradyan yollarını kontrol ederek ağın öğrenme kabiliyetini artıran gelişmiş bir backbone yapısı. Bu, modelin daha çeşitli özellikleri öğrenmesini sağlar.
- Birleştirme Tabanlı Modeller için Model Ölçeklendirme: Standart ölçeklendirmenin aksine YOLOv7 , birleştirme tabanlı mimariler için derinlik ve genişliği aynı anda ölçeklendirerek optimum kaynak kullanımı sağlar.
- Eğitilebilir Bag-of-Freebies: Bu, planlı yeniden parametreli konvolüsyon (RepConv) ve yardımcı kafa eğitimini içerir. Yardımcı başlıklar, eğitim sırasında öğrenme sürecini yönlendirmeye yardımcı olan ancak hızı korumak için çıkarım sırasında kaldırılan kaba-ince hiyerarşik etiketler oluşturur.
'Bedava Çantası' nedir?
"Bag of Freebies", çıkarım maliyetini artırmadan bir nesne algılama modelinin doğruluğunu artıran eğitim yöntemleri ve veri artırma teknikleri koleksiyonunu ifade eder. YOLOv7'de bu, Kaba-İnce Kurşun Kılavuzlu Etiket Atama gibi sofistike stratejileri içerir.
YOLOv7 için İdeal Kullanım Durumları
Yüksek doğruluğa odaklanması nedeniyle, YOLOv7 özellikle aşağıdakiler için çok uygundur:
- Akademik Araştırma: Her mAP kesrinin önemli olduğu SOTA modellerine karşı kıyaslama.
- Üst Düzey GPU Dağıtımı: Daha büyük model boyutlarını ve bellek gereksinimlerini karşılamak için güçlü donanımların ( NVIDIA A100'ler gibi) mevcut olduğu uygulamalar.
- Statik Analiz: Yüksek çözünürlüklü uydu görüntülerinin veya tıbbi taramaların analizi gibi gerçek zamanlı gecikmenin hassasiyetten daha az kritik olduğu senaryolar.
YOLOv7 hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Endüstri Standardı
Ultralytics YOLOv5 , mevcut en pratik ve kullanıcı dostu nesne algılama modellerinden biri olarak kabul edilmektedir. 2020'de piyasaya sürülmesinden bu yana, hız, doğruluk ve mühendislik mükemmelliği dengesi nedeniyle sayısız ticari uygulamanın backbone haline geldi.
Yazarlar: Glenn Jocher
Organizasyon:Ultralytics
Tarih: 2020-06-26
GitHubyolov5
Docsyolov5yolov5
Mimari ve Ekosistem Faydaları
YOLOv5 , çeşitli dağıtım hedefleri için optimize edilmiş bir PANet boynu ve bir YOLOv3 kafası ile bir CSP-Darknet53 backbone kullanır. Bununla birlikte, gerçek gücü Ultralytics ekosisteminde yatmaktadır:
- Kullanım Kolaylığı: "Kur ve çalıştır" felsefesiyle tanınan YOLOv5 , geliştiricilerin dakikalar içinde özel veri kümeleri üzerinde eğitime başlamasına olanak tanır. API sezgiseldir ve belgeler kapsamlıdır.
- Eğitim Verimliliği: YOLOv5 , eğitim sırasında daha yeni, daha karmaşık mimarilere kıyasla genellikle daha az CUDA belleği gerektirir ve bu da onu orta sınıf GPU'lara sahip geliştiriciler için erişilebilir hale getirir.
- Dağıtım Esnekliği: Tek tıklamayla dışa aktarmayı destekler ONNX, TensorRT, CoreML, TFLite ve daha fazlası, bulut sunucularından cep telefonlarına kadar her şeyde dağıtımı kolaylaştırır.
- İyi Korunan Ekosistem: Sık güncellemeler, hata düzeltmeleri ve büyük bir topluluk ile Ultralytics , modelin üretim ortamları için istikrarlı ve güvenli kalmasını sağlar.
YOLOv5 için İdeal Kullanım Durumları
YOLOv5 , güvenilirlik ve hız gerektiren gerçek dünya senaryolarında üstünlük sağlar:
- Edge AI: gibi cihazlar üzerinde çalışan NVIDIA Jetson veya hafif Nano nedeniyle Raspberry Pi (
yolov5n) ve Küçük (yolov5s) varyantları. - Mobil Uygulamalar: Cihaz üzerinde çıkarım için CoreML ve TFLite aracılığıyla iOS ve Android uygulamalarına entegrasyon.
- Hızlı Prototipleme: Konseptten MVP'ye hızlı bir şekilde geçmesi gereken girişimler ve geliştiriciler, kolaylaştırılmış iş akışından yararlanır.
- Endüstriyel Otomasyon: Reliable detection for manufacturing lines where latency and stability are paramount.
YOLOv5 hakkında daha fazla bilgi edinin
Detaylı Karşılaştırmalı Analiz
YOLOv7 ve YOLOv5 arasında karar verirken, sadece mAP skorunun ötesinde birkaç teknik faktör devreye girer.
1. Hız ve Doğruluk Takası
YOLOv7 , COCO veri kümesinde daha yüksek tepe doğruluğuna ulaşır. Örneğin, YOLOv5x'in %50,7'sine kıyasla YOLOv7x %53,1 mAP 'ye ulaşır. Ancak bunun bedeli karmaşıklıktır. YOLOv5 daha yumuşak bir model gradyanı sunar; YOLOv5n (Nano) modeli inanılmaz derecede hızlı (73,6 ms CPU hızı) ve hafiftir (2,6 milyon parametre) ve YOLOv7 'nin aynı ayrıntı düzeyiyle açıkça hedeflemediği ultra düşük kaynaklı ortamlar için bir niş oluşturur.
2. Mimari ve Karmaşıklık
YOLOv7 , eğitim sırasında gereken bellek bant genişliğini artıran E-ELAN ile birleştirme tabanlı bir mimari kullanır. Bu, YOLOv5'e göre daha yavaş eğitilmesine ve daha fazla bellek tüketmesine neden olabilir. Buna karşılık, Ultralytics YOLOv5 , eğitim verimliliği için son derece optimize edilmiş, daha hızlı yakınsama ve daha düşük bellek kullanımı sağlayan modern bir mimari kullanır; bu, sınırlı hesaplama bütçesine sahip mühendisler için önemli bir avantajdır.
3. Kullanılabilirlik ve Geliştirici Deneyimi
Ultralytics YOLOv5 'in gerçekten parladığı yer burasıdır. Ultralytics çerçevesi, veri artırma, hiperparametre evrimi ve deney izleme için sağlam araçlarla birleşik bir deneyim sağlar.
import torch
# Example: Loading YOLOv5s from PyTorch Hub for inference
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Print results
results.print()
YOLOv7 bir depoya sahip olsa da, Ultralytics ekosistemini destekleyen cilalı, üretime hazır CI / CD boru hatları, kapsamlı entegrasyon kılavuzları ve topluluk desteğinden yoksundur.
4. Çok yönlülük
Her iki model de öncelikle nesne algılama mimarileri olsa da, YOLOv5 'i çevreleyen Ultralytics ekosistemi, örnek segmentasyonunu ve görüntü sınıflandırmasını sorunsuz bir şekilde destekleyecek şekilde gelişmiştir. YOLOv7 de bu görevleri destekler, ancak genellikle kodun farklı dallarını veya çatallarını gerektirir, oysa Ultralytics daha birleşik bir yaklaşım sunar.
Dağıtım Artık Çok Kolay
Ultralytics modelleri, kutudan çıkar çıkmaz çok çeşitli dışa aktarma formatlarını destekler. Eğitimli modelinizi kolayca şu modellere dönüştürebilirsiniz TFLiteAndroid için, CoreMLiOS için veya TensorRT Basit bir CLI komutu veya Python betiği kullanarak optimize edilmiş GPU çıkarımı için.
Sonuç: Hangi Modeli Seçmelisiniz?
YOLOv7 ve YOLOv5 arasındaki seçim proje önceliklerinize bağlıdır:
- Birincil kısıtınız maksimum doğruluksa ve bir araştırma ortamında veya çıkarım hızı ve bellek ayak izinin ikincil kaygılar olduğu üst düzey donanımlarda çalışıyorsanız YOLOv7 'yi seçin.
- Güvenilir, üretime hazır bir çözüme ihtiyacınız varsa Ultralytics YOLOv5 'i seçin. Kullanım kolaylığı, verimli eğitimi, uç cihazlarda düşük gecikme süresi ve büyük destek ekosistemi, bilgisayarla görme yolculuğuna başlayan çoğu ticari uygulama ve geliştirici için üstün bir seçim olmasını sağlar.
Geleceğe Bakış: YOLO11
YOLOv5 ve YOLOv7 mükemmel modeller olsa da, bilgisayarla görme alanı hızla ilerlemektedir. Her iki dünyanın da en iyisini arayan geliştiriciler için - YOLOv7 'nin doğruluğunu ve YOLOv5'in hızını/kullanılabilirliğini aşarak - şunları keşfetmenizi şiddetle tavsiye YOLOv5Ultralytics YOLO11.
YOLO11 , eğitim hattını basitleştiren ve algılama, segmentasyon, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere tüm görevlerde performansı artıran çapasız bir mimari içeren en son evrimi temsil eder.
Diğer Modelleri İnceleyin
YOLO ailesindeki diğer modelleri karşılaştırmakla ilgileniyorsanız, bu ilgili sayfalara göz atın: