İçeriğe geç

YOLOv10 vs YOLOv7: Detaylı Bir Karşılaştırma

Doğru nesne algılama modelini seçmek, bilgisayarla görme projeleri için kritik öneme sahiptir. Ultralytics YOLO , farklı ihtiyaçlara göre uyarlanmış bir dizi model sunar. Bu sayfa, nesne algılama görevleri için iki popüler seçenek olan YOLOv10 ve YOLOv7 arasında teknik bir karşılaştırma sağlar. Bilinçli bir karar vermenize yardımcı olmak için mimarilerini, performans ölçümlerini ve ideal uygulamalarını analiz edeceğiz.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4TensorRT10
(ms)
params
(M)
FLOP'lar
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

YOLOv10

Tsinghua Üniversitesi'nden araştırmacılar tarafından Mayıs 2024'te tanıtılan YOLOv10, gerçek zamanlı nesne algılamanın en ileri noktasını temsil ediyor."YOLOv10: Gerçek Zamanlı Uçtan Uca Nesne Algılama" başlıklı Arxiv makalelerinde ayrıntılı olarak açıklanan Ao Wang, Hui Chen, Lihao Liu ve diğerleri, YOLOv10'u hem verimlilik hem de doğruluğa odaklanan önemli bir ilerleme olarak sunuyor. Resmi uygulama GitHub'da mevcuttur. YOLOv10 uçtan uca dağıtım için tasarlanmıştır ve önceki YOLO sürümlerinin Maksimum Olmayan Bastırma'ya (NMS) olan bağımlılığını ele almaktadır.

Mimari ve Temel Özellikler:

YOLOv10, hızı artırmayı ve hesaplama fazlalığını azaltmayı amaçlayan çeşitli mimari yeniliklere sahiptir. Temel özellikler arasında çapa içermeyen bir yaklaşım ve NMS içermeyen tasarım, son işlemeyi kolaylaştırır ve çıkarımı hızlandırır. Model, minimum ek yük ve maksimum kapasite için çeşitli bileşenleri optimize eden bütünsel bir verimlilik-doğruluk odaklı tasarım stratejisi benimser. Bu, yalnızca daha hızlı değil aynı zamanda rekabetçi doğruluğu koruyan bir modelle sonuçlanır ve bu da onu uç cihazlar ve gerçek zamanlı uygulamalar için uygun hale getirir.

Performans Ölçütleri ve Kıyaslamalar:

Karşılaştırma tablosunda gösterildiği gibi, YOLOv10 modelleri, özellikle de YOLOv10n ve YOLOv10s varyantları, TensorRT üzerinde etkileyici çıkarım hızları sunarak sırasıyla 1,56 ms ve 2,66 ms'ye ulaşmaktadır. YOLOv10n yalnızca 2,3M parametre ve 6,7B FLOP ile 39,5 mAPval50-95 değerine ulaşırken, YOLOv10x 54,4 mAPval50-95 değerine ulaşıyor. Bu ölçümler, YOLOv10'un optimize edilmiş hesaplama kaynaklarıyla son teknoloji performans sunma yeteneğini vurgulamaktadır. YOLO performans metriklerini daha iyi anlamak için YOLO performans metrikleriyle ilgili Ultralytics belgelerine bakın.

Kullanım Örnekleri:

YOLOv10'un gerçek zamanlı performans ve verimliliğe verdiği önem, onu sınırlı hesaplama kaynaklarıyla hızlı nesne tespiti gerektiren uygulamalar için ideal kılmaktadır. Uygun kullanım durumları şunları içerir:

  • Uç Yapay Zeka Uygulamaları: Akıllı kameralar ve IoT cihazları gibi senaryolarda gerçek zamanlı işleme için uç cihazlarda dağıtım.
  • Robotik: Yapay zekanın robotikteki rolü bölümünde tartışıldığı gibi, robotik sistemlerde navigasyon ve etkileşim için daha hızlı ve daha verimli nesne tanımayı mümkün kılmak.
  • Otonom Sistemler: Güvenli ve etkili çalışma için düşük gecikmenin çok önemli olduğu otonom araçlar ve dronlardaki uygulamalar.
  • Mobil ve Gömülü Sistemler: Mobil uygulamalarda ve kısıtlı hesaplama gücüne sahip gömülü sistemlerde nesne algılama.

Güçlü yönler:

  • Yüksek Verimlilik: Daha hızlı çıkarım ve daha düşük gecikme süresi için NMS içermeyen tasarım ve optimize edilmiş mimari.
  • Rekabetçi Doğruluk: Hızı önemli ölçüde artırırken güçlü doğruluğu korur.
  • Uçtan Uca Dağıtım: Sorunsuz, uçtan uca gerçek zamanlı nesne algılama için tasarlanmıştır.
  • Daha Küçük Model Boyutları: Verimli mimari, bazı öncüllere kıyasla daha küçük model boyutlarına ve daha az parametreye yol açar.

Zayıflıklar:

  • Nispeten Yeni: Daha yeni bir model olan YOLOv10, YOLOv7 gibi daha köklü modellere kıyasla daha küçük bir topluluğa ve daha az dağıtım örneğine sahip olabilir.
  • Performans Ayarı: Optimum performansa ulaşmak, model eğitim ipuçlarında ayrıntılı olarak açıklandığı gibi, farklı model boyutları ve yapılandırmalarıyla ince ayar ve denemeler gerektirebilir.

YOLOv10 hakkında daha fazla bilgi edinin

YOLOv7

Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından Temmuz 2022'de tanıtılan YOLOv7, verimliliği ve doğruluğu ile bilinen ve oldukça beğenilen bir nesne algılama modelidir. Model, Arxiv'deki"YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors" başlıklı makalede ayrıntılı olarak açıklanmıştır ve resmi GitHub deposu uygulama ayrıntılarını sunmaktadır. YOLOv7, hesaplama maliyetini önemli ölçüde artırmadan performansı en üst düzeye çıkarmak için mimari iyileştirmeler içeren önceki YOLO sürümleri üzerine inşa edilmiştir.

Mimari ve Temel Özellikler:

YOLOv7, performansını ve verimliliğini artırmak için çeşitli mimari yenilikler içermektedir. Temel özellikler şunlardır:

  • Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN): Ağın öğrenme yeteneklerini ve gradyan akışını geliştirir.
  • Birleştirme Tabanlı Modeller için Model Ölçeklendirme: Etkili derinlik ve genişlik ölçeklendirmesi için yönergeler sağlar.
  • Yardımcı Başlık ve Kaba-İnce Kurşun Başlık: Eğitim verimliliğini ve algılama doğruluğunu artırır.

Bu özellikler, YOLOv7'nin hız ve doğruluk açısından son teknoloji ürünü sonuçlar elde etmesine katkıda bulunarak onu çeşitli nesne algılama görevleri için sağlam bir seçim haline getirir.

Performans Ölçütleri ve Kıyaslamalar:

YOLOv7, hız ve doğruluk arasında güçlü bir denge olduğunu göstermektedir. Tabloda gösterildiği gibi, YOLOv7l 51,4 mAPval50-95 değerine ulaşırken, YOLOv7x 53,1 mAPval50-95 değerine ulaşmaktadır. TensorRT çıkarım hızında YOLOv10n ve YOLOv10s'den biraz daha yavaş olsa da, YOLOv7 modelleri, özellikle daha büyük YOLOv7 model boyutları göz önüne alındığında, hala rekabetçi bir performans sunmaktadır. Ayrıntılı ölçümler için YOLOv7 belgelerine bakın.

Kullanım Örnekleri:

YOLOv7'nin doğruluk ve verimlilik dengesi, onu gerçek zamanlı senaryolarda güvenilir nesne algılama gerektiren uygulamalar için uygun hale getirir. İdeal kullanım durumları şunları içerir:

  • Otonom Araçlar: Sürücüsüz Araçlarda Yapay Zeka için kritik öneme sahip olan karmaşık sürüş ortamlarında sağlam nesne algılama.
  • Gelişmiş Gözetim Sistemleri: Güvenlik sistemlerindeki potansiyel güvenlik tehditlerini tanımlamak için yüksek doğruluk.
  • Robotik: Robotikte manipülasyon ve navigasyon için hassas nesne tanıma, YOLOv10'a benzer, ancak potansiyel olarak belirli senaryolarda doğruluğu tercih eder.
  • Endüstriyel Otomasyon: Doğruluğun çok önemli olduğu üretim süreçlerinde kalite kontrol ve hata tespiti.

Güçlü yönler:

  • Yüksek mAP: Mükemmel nesne algılama doğruluğunu gösteren yüksek Ortalama Ortalama Hassasiyet elde eder.
  • Verimli Çıkarım: Gerçek zamanlı uygulamalar için uygun, hızlı çıkarım için tasarlanmıştır.
  • Köklü ve Olgun: YOLOv7, daha fazla kaynak ve destek sağlayan daha büyük bir topluluktan ve kapsamlı kullanımdan yararlanır.
  • Yönetilebilir Model Boyutları: Model boyutu ve performans arasında iyi bir denge sunar.

Zayıflıklar:

  • Karmaşıklık: Mimari, bazı daha basit modellerden daha karmaşıktır ve potansiyel olarak ince ayar ve optimizasyon için daha fazla uzmanlık gerektirir.
  • Nano Modellerle Karşılaştırıldığında Kaynak Yoğun: Verimli olmakla birlikte, özellikle aşırı kaynak kısıtlı ortamlarda YOLOv10n gibi daha küçük modellere göre hesaplama açısından daha yoğundur.

YOLOv7 hakkında daha fazla bilgi edinin

Diğer YOLO Modelleri

Ultralytics , YOLOv10 ve YOLOv7'nin yanı sıra, her biri benzersiz güçlü yönlere sahip bir dizi YOLO modeli sunar. Keşfetmeyi düşünün YOLOv8 çok yönlü ve kullanıcı dostu bir seçenek için, YOLOv9 ağ mimarisindeki gelişmeler için ve YOLO11 en son teknoloji ürünü performans için. YOLOv7'yi aşağıdaki gibi diğer modellerle de karşılaştırabilirsiniz YOLOv5 ve YOLOX 'un özel ödünleşimlerini anlamak için.

📅1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar