İçeriğe geç

YOLOv6-3.0 - YOLOv7 karşılaştırması: Ayrıntılı Teknik Karşılaştırma

Optimum nesne algılama modelini seçmek, doğruluk, hız ve kaynak kullanımı arasında bir denge gerektiren bilgisayarla görme projelerinde kritik bir karardır. Bu sayfa, nesne algılama yetenekleriyle bilinen iki öne çıkan model olan YOLOv6-3.0 ve YOLOv7 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Model seçim sürecinize rehberlik etmek için mimarilerini, performans kıyaslamalarını ve uygun uygulamalarını inceleyeceğiz.

YOLOv6-3.0: Endüstriyel Hız için Tasarlandı

Meituan tarafından geliştirilen YOLOv6-3.0, hız ve verimliliğe odaklanarak yüksek performanslı nesne algılama gerektiren endüstriyel uygulamalar için tasarlanmıştır. 3.0 sürümü, önceki sürümlerine göre önemli ölçüde geliştirilmiş, daha iyi doğruluk ve daha hızlı çıkarım süreleri sunarak gerçek zamanlı sistemler için güçlü bir rakip haline gelmiştir.

Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Belgeler: https://docs.ultralytics.com/models/yolov6/

Mimari ve Temel Özellikler

YOLOv6-3.0, verimli bir yeniden parametrelendirme backbone'undan yararlanan, donanım farkında bir sinir ağı tasarımı sunar. Bu tasarım seçimi, endüstriyel dağıtım için kritik bir faktör olan çıkarım hızlarını hızlandırma yeteneğinin merkezinde yer alır. Mimari ayrıca, doğruluk ve hesaplama verimliliği arasında optimum bir denge kurmak için titizlikle tasarlanmış hibrit bir blok yapısı içerir. Donanım dostu olmaya odaklanması, modelin sunuculardan uç cihazlara kadar çeşitli dağıtım platformlarında iyi performans göstermesini sağlar.

Güçlü Yönler

  • Yüksek Çıkarım Hızı: Hızlı çıkarım için optimize edilmiştir, bu da onu katı gecikme gereksinimleri olan uygulamalar için oldukça uygun hale getirir.
  • Endüstriyel Odak: Üretimde Yapay Zeka gibi ortamlarda sağlamlık ve verimlilik sağlayarak, pratik endüstriyel senaryolar göz önünde bulundurularak tasarlanmıştır.
  • Donanım Farkındalıklı Tasarım: Mimari, CPU'lar ve GPU'lar da dahil olmak üzere çeşitli donanım platformlarında verimli performans için uyarlanmıştır.

Zayıflıklar

  • Doğruluk Dengesi: Yüksek verimli olmasına rağmen, karmaşık veri kümelerinde, maksimum hassasiyete öncelik veren YOLOv7 gibi modellere kıyasla biraz daha düşük doğruluk gösterebilir.
  • Sınırlı Çok Yönlülük: Orijinal çerçeve öncelikli olarak nesne algılama üzerine odaklanmıştır ve daha entegre modellerin aksine, diğer görevler için ayrı uygulamalara sahiptir.

Kullanım Alanları

YOLOv6-3.0, hız ve verimliliğin çok önemli olduğu uygulamalarda öne çıkar:

  • Endüstriyel Otomasyon: Hızlı tespit gerektiren kalite kontrolü, süreç takibi ve diğer endüstriyel uygulamalar için idealdir.
  • Gerçek Zamanlı Sistemler: Gerçek zamanlı gözetim, robotik ve katı gecikme kısıtlamaları olan uygulamalarda dağıtım için uygundur.
  • Edge Computing: Verimli tasarımı, kaynak kısıtlamalı cihazlarda dağıtım için harika bir seçim olmasını sağlar. NVIDIA Jetson gibi cihazlara dağıtım hakkındaki kılavuzumuza göz atın.

YOLOv6-3.0 hakkında daha fazla bilgi edinin

YOLOv7: Doğruluk Sınırlarını Zorlamak

Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'ndeki araştırmacılar tarafından geliştirilen YOLOv7, verimliliği korurken yüksek doğruluk elde etmeye odaklanarak gerçek zamanlı nesne algılamada önemli bir atılımı temsil eder.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/

Mimari ve Temel Özellikler

YOLOv7, çıkarım maliyetlerini önemli ölçüde artırmadan performansı artırmayı amaçlayan çeşitli mimari yenilikler ve eğitim stratejileri sunar. Temel özellikler şunları içerir:

  • E-ELAN (Genişletilmiş-Verimli Katman Toplama Ağları): Bu yeni ağ tasarımı, modelin özellikleri etkili bir şekilde öğrenme yeteneğini geliştirerek hem parametre hem de hesaplama verimliliğini artırır. Daha fazla ayrıntıyı orijinal makalede bulabilirsiniz.
  • Bileşik Model Ölçekleme: Farklı model boyutlarında performansı optimize ederek model derinliği ve genişliği için bileşik ölçekleme yöntemleri uygular.
  • "Bedava Ganimetler" İyileştirmeleri: YOLOv7, ekstra çıkarım maliyeti olmadan doğruluğu artıran, geliştirilmiş veri artırma ve etiket atama stratejileri gibi gelişmiş eğitim tekniklerini içerir. Veri artırma kılavuzumuzda benzer teknikleri keşfedin.
  • Yardımcı Başlık Eğitimi: Özellik öğrenimini güçlendirmek için eğitim aşamasında yardımcı başlıklar kullanır. Bu başlıklar daha sonra yüksek hızı korumak için çıkarım için kaldırılır.

Güçlü Yönler

  • Yüksek Doğruluk: COCO veri kümesi gibi standart kıyaslama testlerinde son teknoloji ürünü doğruluğa ulaşır.
  • Verimli Performans: Yüksek doğruluğu rekabetçi çıkarım hızlarıyla dengeler, bu da onu birçok gerçek zamanlı uygulama için uygun hale getirir.
  • Çok Yönlülük: Resmi depo, poz tahmini ve örnek segmentasyonu dahil olmak üzere algılama ötesindeki görevler için topluluk odaklı desteği gösterir.

Zayıflıklar

  • Karmaşıklık: Gelişmiş mimari özellikleri ve eğitim teknikleri, modeli daha basit mimarilere kıyasla anlamayı ve ince ayar yapmayı daha karmaşık hale getirebilir.
  • Yoğun Kaynak Gerektiren Eğitim: Daha büyük YOLOv7 varyantları (örn. YOLOv7-E6E), eğitim için önemli miktarda işlem gücü gerektirir.

Kullanım Alanları

YOLOv7, yüksek doğruluğun birincil hedef olduğu uygulamalar için mükemmel bir seçimdir:

  • Gelişmiş Gözetim: Gelişmiş güvenlik için kalabalık sahnelerde ince veya küçük nesneleri tespit etme.
  • Otonom Sistemler: Otonom sürüşlü arabalar veya dronlarda güvenli navigasyon için hassas nesne tespiti sağlar.
  • Bilimsel Araştırma: Yüksek hassasiyetin doğru sonuçlar için çok önemli olduğu karmaşık görsel verileri analiz etme.

YOLOv7 hakkında daha fazla bilgi edinin

Performans Karşılaştırması: YOLOv6-3.0 - YOLOv7

Aşağıdaki tablo, COCO veri kümesindeki YOLOv6-3.0 ve YOLOv7'nin karşılaştırılabilir varyantları için performans metriklerini özetlemektedir.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Not: Hız kıyaslamaları donanıma, yazılıma (TensorRT, ONNX, OpenVINO), toplu iş boyutuna ve belirli yapılandırmalara bağlı olarak değişebilir. mAP değerleri tipik olarak COCO val veri kümesinde raporlanır.

Tabloya göre, YOLOv7x en yüksek mAP'ye ulaşarak üstün doğruluk gösterir. Bununla birlikte, YOLOv6-3.0 modelleri, özellikle YOLOv6-3.0n gibi daha küçük varyantlar, özellikle GPU'da TensorRT optimizasyonu ile önemli ölçüde daha hızlı çıkarım hızları sunar. Ayrıca daha az parametreye ve FLOP'a sahiptirler, bu da onları oldukça verimli kılar. Seçim, önceliğin maksimum doğruluk (YOLOv7) mu yoksa optimum hız ve verimlilik (YOLOv6-3.0) mi olduğuna bağlıdır.

Ultralytics Avantajı: Neden YOLOv8 ve YOLO11'i Seçmelisiniz?

YOLOv6 ve YOLOv7 güçlü modeller olsa da, kapsamlı ve kullanıcı dostu bir ekosistem içinde son teknoloji bir çözüm arayan geliştiriciler ve araştırmacılar, en son Ultralytics YOLO modellerini göz önünde bulundurmalıdır. Ultralytics YOLOv8 ve en yeni YOLO11 gibi modeller çeşitli önemli avantajlar sunar:

  • Kullanım Kolaylığı: Ultralytics modelleri, geliştirici deneyimi göz önünde bulundurularak tasarlanmıştır ve eğitim, doğrulama ve dağıtımı basitleştiren kolaylaştırılmış bir Python API'si, kapsamlı belgelendirme ve basit CLI komutları içerir.
  • İyi Yönetilen Ekosistem: Aktif geliştirme, güçlü bir açık kaynak topluluğu, sık güncellemeler ve uçtan uca MLOps için Ultralytics HUB gibi araçlarla sorunsuz entegrasyondan yararlanın.
  • Çok Yönlülük: YOLOv8 ve YOLO11 gibi modeller gerçek çoklu görevlidir ve tek, birleşik bir çerçeve içinde nesne tespiti, segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne tespiti (OBB)'ni destekler.
  • Performans Dengesi: Ultralytics modelleri, kenar cihazlardan bulut sunucularına kadar çok çeşitli gerçek dünya senaryoları için uygun olmalarını sağlayan hız ve doğruluk arasında mükemmel bir denge sağlar.
  • Eğitim Verimliliği: Değerli zamandan ve hesaplama kaynaklarından tasarruf sağlayan verimli eğitim süreçlerinden, kolayca erişilebilen önceden eğitilmiş ağırlıklardan ve daha hızlı yakınsama sürelerinden yararlanın.

Sonuç

Hem YOLOv6-3.0 hem de YOLOv7, bilgisayar görüşünde mümkün olanın sınırlarını zorlayan güçlü nesne algılama modelleridir. YOLOv6-3.0, çıkarım hızına ve verimliliğine öncelik veren senaryolarda mükemmeldir, bu da onu endüstriyel uygulamalar ve uç nokta dağıtımı için ideal kılar. Buna karşılık, YOLOv7 daha yüksek tepe doğruluğu sunar ve bu da onu hassasiyetin birincil endişe olduğu görevler için güçlü bir seçim haline getirir, ancak potansiyel olarak daha yüksek bir hesaplama maliyetiyle.

Son teknoloji ürünü diğer seçenekleri keşfetmek isteyen kullanıcılar için Ultralytics, performans, çok yönlülük ve kullanım kolaylığı açısından üstün bir denge sağlayan YOLOv8 ve YOLO11 gibi modeller sunar. Daha fazla keşif için YOLOX ve RT-DETR gibi diğer modellerle karşılaştırmalarımızı da faydalı bulabilirsiniz.



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar