İçeriğe geç

YOLOv5 - YOLOv7: Ayrıntılı Bir Karşılaştırma

Doğru nesne algılama modelini seçmek, hız, doğruluk ve dağıtım kolaylığı ihtiyacını dengeleyen kritik bir karardır. Bu sayfa, Ultralytics YOLOv5 ve YOLOv7 olmak üzere bilgisayarla görü alanındaki iki etkili model arasında teknik bir karşılaştırma sunmaktadır. Her ikisi de önemli katkılarda bulunmuş olsa da, Ultralytics YOLOv5, olağanüstü performans dengesi, kullanıcı dostu tasarım ve kapsamlı, iyi yönetilen bir ekosistem ile öne çıkmakta ve bu da onu çok çeşitli gerçek dünya uygulamaları için tercih edilen bir seçim haline getirmektedir.

Ultralytics YOLOv5: Yerleşik Endüstri Standardı

Glenn Jocher tarafından 2020'de piyasaya sürülen Ultralytics YOLOv5, hız, doğruluk ve kullanım kolaylığının dikkat çekici birleşimi sayesinde hızla en popüler nesne algılama modellerinden biri haline geldi. Tamamen PyTorch ile geliştirilen YOLOv5, eğitimden dağıtıma kadar kolaylaştırılmış bir deneyim sunarak yüksek düzeyde optimize edilmiştir.

Yazar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeler: https://docs.ultralytics.com/models/yolov5/

YOLOv5'in Mimarisi ve Temel Özellikleri

YOLOv5, etkili özellik toplama için bir CSPDarknet53 backbone ve bir PANet boynu üzerine inşa edilmiş esnek ve verimli bir mimariye sahiptir. Çok sayıda sürümde iyileştirilmiş, anchor tabanlı bir algılama başlığı kullanır. Temel güçlü yönlerinden biri, geliştiricilerin performans ve hesaplama kaynakları arasında en uygun dengeyi seçmelerine olanak tanıyan çeşitli model boyutlarıdır (n, s, m, l, x). Bu ölçeklenebilirlik, onu hafif uç cihazlardan güçlü bulut sunucularına kadar her şey için uygun hale getirir.

YOLOv5'in Güçlü Yönleri

  • Kullanım Kolaylığı: YOLOv5, basit Python ve CLI arayüzleri, kapsamlı belgeleri ve basit eğitim ve çıkarım ardışık düzenleri ile ünlüdür.
  • İyi Yönetilen Ekosistem: Aktif geliştirme, geniş bir topluluk, sık güncellemeler ve kodsuz eğitim ve dağıtım için Ultralytics HUB gibi güçlü araçları içeren sağlam Ultralytics ekosistemi tarafından desteklenmektedir.
  • Performans Dengesi: YOLOv5, çıkarım hızı ve tespit doğruluğu arasında mükemmel bir denge sağlar ve bu da onu çeşitli gerçek dünya senaryoları için oldukça pratik hale getirir.
  • Çok Yönlülük ve Eğitim Verimliliği: Nesne algılama, örnek segmentasyonu ve görüntü sınıflandırması dahil olmak üzere birden çok görüntü işleme görevini destekler. Eğitim süreci verimlidir; önceden eğitilmiş ağırlıklar kolayca bulunur ve daha karmaşık mimarilere kıyasla daha az bellek gereksinimi vardır.

YOLOv5'in Zayıflıkları

  • Doğruluk Sınırları: Oldukça doğru olmasına rağmen, daha yeni modeller COCO gibi standart kıyaslamalarda mAP puanlarını aşmıştır.
  • Anchor-Based Design: Önceden tanımlanmış anchor kutularına dayanması, modern anchor-free yaklaşımlara kıyasla bazen alışılmadık şekilli nesnelere sahip veri kümeleri için daha fazla ayarlama gerektirebilir.

YOLOv5 için Kullanım Alanları

  • Gerçek Zamanlı Uygulamalar: Robotik, yapay zeka drone operasyonlarındaki bilgisayar görüşü uygulamalarında drone görüşü ve gerçek zamanlı video analizi gibi hızlı çıkarım gerektiren uygulamalar için idealdir.
  • Uç Nokta Dağıtımı: Verimli tasarımı ve daha küçük model boyutları nedeniyle sınırlı kaynaklara sahip uç nokta cihazlarında dağıtım için çok uygundur. NVIDIA Jetson dağıtım kılavuzlarını inceleyin.
  • Hızlı Prototipleme: Kullanım kolaylığı ve kapsamlı desteği sayesinde, nesne algılama çözümlerinin hızlı prototiplemesi ve dağıtımı için mükemmel bir seçimdir.

YOLOv5 hakkında daha fazla bilgi edinin

YOLOv7: Yüksek Doğruluk Odağı

Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından oluşturulan YOLOv7, 6 Temmuz 2022'de yayınlandı. Gerçek zamanlı hızı korurken doğruluğun sınırlarını zorlamayı amaçlayan ve "eğitilebilir bedava hediyeler çantası" olarak bilinen çeşitli mimari optimizasyonlar ve eğitim stratejileri sundu.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arşiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/

YOLOv7'nin Mimarisi ve Temel Özellikleri

  • E-ELAN: Öğrenme yeteneğini geliştirmek için backboneda Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) kullanır.
  • Model Ölçeklendirme: Farklı hesaplama bütçeleri için optimize etmek üzere model derinliği ve genişliği için bileşik ölçeklendirme uygular.
  • Yardımcı Başlık Eğitimi: Özellik öğrenimini geliştirmek için eğitim sırasında yardımcı başlıklar kullanır (çıkarım sırasında kaldırılır).
  • Bedava Hileler Çantası: Çıkarım maliyetini artırmadan doğruluğu artırmak için gelişmiş eğitim tekniklerinden yararlanır.

YOLOv7'nin Güçlü Yönleri

  • Yüksek Doğruluk: Özellikle daha büyük model varyantları ile COCO gibi kıyaslamalarda yüksek mAP skorları elde eder.
  • Verimli Eğitim Teknikleri: Performansı en üst düzeye çıkarmak için yeni eğitim stratejileri içerir.

YOLOv7'nin Zayıflıkları

  • Karmaşıklık: Mimari ve eğitim süreci, Ultralytics YOLOv5'in basitleştirilmiş yaklaşımına kıyasla daha karmaşık olabilir.
  • Ekosistem ve Destek: Ultralytics'in YOLOv5 için sağladığı kapsamlı dokümantasyon, eğitimler ve entegre ekosistemden yoksundur.
  • Kaynak Yoğun: Daha büyük modeller önemli miktarda işlem kaynağı gerektirir ve bu da kısıtlı cihazlarda dağıtımı potansiyel olarak sınırlar.

YOLOv7 için Kullanım Alanları

  • Yüksek Performanslı Algılama: Gelişmiş gözetim veya otonom araçlar gibi mutlak en yüksek doğruluğu elde etmenin kritik olduğu ve hesaplama kaynaklarının daha az kısıtlı olduğu uygulamalar için uygundur.
  • Araştırma: En son teknoloji nesne algılama tekniklerini araştıran akademik araştırmalarda kullanılır.

YOLOv7 hakkında daha fazla bilgi edinin

Performans ve Teknik Karşılaştırma

COCO veri kümesi üzerinde YOLOv5 ve YOLOv7'nin doğrudan karşılaştırılması, performans profillerindeki temel farklılıkları ortaya koymaktadır. YOLOv7 modelleri genellikle daha yüksek mAP puanları elde eder, ancak genellikle artan karmaşıklık ve kaynak gereksinimleri pahasına. Buna karşılık, Ultralytics YOLOv5, CPU çıkarım hızında mükemmellik ve birçok gerçek dünya dağıtımı için çok önemli olan rekabetçi doğruluğu koruyarak daha dengeli bir profil sunar.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Sonuç: Hangi Modeli Seçmelisiniz?

YOLOv5 ve YOLOv7 arasındaki seçim büyük ölçüde proje önceliklerine bağlıdır.

YOLOv7, standart kıyaslama testlerinde mümkün olan en yüksek doğruluğa ihtiyaç duyan ve önemli miktarda işlem kaynağına erişimi olan araştırmacılar ve geliştiriciler için güçlü bir seçimdir. Yenilikçi eğitim teknikleri, performans sınırlarının nasıl zorlanacağını gösterir.

Ancak, pratik uygulamaların büyük çoğunluğu için Ultralytics YOLOv5 üstün seçim olmaya devam ediyor. Temel avantajları—kullanım kolaylığı, hızlı dağıtım, mükemmel hız-doğruluk dengesi ve gelişen bir ekosistem—onu inanılmaz derecede verimli ve güvenilir bir araç haline getiriyor. Geliştiricilerin ilk prototipten üretim dağıtımına kadar sağlam bilgisayarlı görü çözümlerini hızla oluşturmalarını sağlar.

Ayrıca, Ultralytics ekosistemi gelişmeye devam etti. YOLOv8 ve YOLO11 gibi daha yeni modeller, YOLOv5'in temeli üzerine inşa edilerek segmentasyon, poz tahmini ve izleme gibi görevlerde daha da iyi performans ve daha fazla çok yönlülük sunar. Modern, geleceğe yönelik ve kullanıcı dostu bir çerçeve arayan geliştiriciler için Ultralytics YOLO ailesi, en çekici ve kapsamlı çözümü sunar.

Diğer Modelleri İnceleyin

Nesne algılama modellerini araştırıyorsanız, bu diğer karşılaştırmalar da ilginizi çekebilir:



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar