YOLOv7 - YOLOv6-3.0: Nesne Tespiti için Detaylı Model Karşılaştırması
Optimum nesne algılama modelini seçmek, doğruluk, hız ve kaynak kullanımı arasında bir denge gerektiren bilgisayarla görme projelerinde kritik bir karardır. Bu sayfa, nesne algılama yetenekleriyle bilinen iki öne çıkan model olan YOLOv7 ve YOLOv6-3.0 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Model seçim sürecinize rehberlik etmek için mimarilerini, performans kıyaslamalarını ve uygun uygulamalarını inceleyeceğiz.
YOLOv7: Doğruluk ve Gelişmiş Teknikler
Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'ndeki araştırmacılar tarafından geliştirilen YOLOv7, verimliliği korurken yüksek doğruluk elde etmeye odaklanarak gerçek zamanlı nesne algılamada önemli bir adımı temsil eder.
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arşiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/
Mimari ve Temel Özellikler
YOLOv7, çıkarım maliyetlerini önemli ölçüde artırmadan performansı artırmayı amaçlayan çeşitli mimari yenilikler ve eğitim stratejileri sunar. Temel özellikler şunları içerir:
- E-ELAN (Genişletilmiş-Verimli Katman Toplama Ağları): Modelin backbone'undaki bu temel bileşen, ağın özellikleri etkili bir şekilde öğrenme yeteneğini geliştirerek parametre ve hesaplama verimliliğini artırır. Daha fazla ayrıntı orijinal makalede bulunabilir.
- Model Ölçeklendirme: Birleştirme tabanlı model prensiplerine dayanarak, farklı model boyutlarında performansı optimize eden model derinliği ve genişliği için bileşik ölçeklendirme yöntemleri uygular.
- Yardımcı Başlık Eğitimi: Özellik öğrenimini güçlendirmek için eğitim aşamasında yardımcı başlıklar kullanır, bunlar daha sonra hızı korumak için çıkarım için kaldırılır. Bu kavram, diğer sinir ağlarında kullanılan derinlemesine denetim teknikleriyle ilgilidir.
- "Bedava Ganimetler" İyileştirmeleri: Ekstra çıkarım maliyeti olmadan doğruluğu artıran veri artırma ve etiket atama iyileştirmeleri gibi gelişmiş eğitim tekniklerini içerir.
Güçlü Yönler
- Yüksek Doğruluk: COCO veri kümesi gibi kıyaslama testlerinde son teknoloji doğruluk elde eder.
- Verimlilik: Yüksek doğruluğu rekabetçi çıkarım hızlarıyla dengeler, gerçek zamanlı çıkarım için uygundur.
- Çok Yönlülük: Resmi depo, poz tahmini ve örnek segmentasyonu dahil olmak üzere, algılama ötesindeki görevler için destek göstermektedir.
Zayıflıklar
- Karmaşıklık: Gelişmiş mimari özellikleri ve eğitim teknikleri, modeli YOLOv5 gibi daha basit mimarilere kıyasla anlamayı ve ince ayar yapmayı daha karmaşık hale getirebilir.
- Yoğun Kaynaklı Eğitim: Daha büyük YOLOv7 varyantları (örn. YOLOv7-E6E) eğitim için önemli miktarda işlem kaynağı gerektirir.
YOLOv7 hakkında daha fazla bilgi edinin
YOLOv6-3.0: Endüstriyel Verimlilik ve Hız
Meituan tarafından geliştirilen YOLOv6-3.0, hız ve verimliliğe odaklanarak yüksek performanslı nesne algılama gerektiren endüstriyel uygulamalar için tasarlanmıştır. 3.0 sürümü, önceki sürümlerini önemli ölçüde geliştirerek iyileştirilmiş doğruluk ve daha hızlı çıkarım süreleri sunar.
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Belgeler: https://docs.ultralytics.com/models/yolov6/
Mimari ve Temel Özellikler
YOLOv6-3.0, dağıtım göz önünde bulundurularak tasarlanmıştır ve çıkarım hızına öncelik veren çeşitli temel mimari seçeneklere sahiptir.
- Donanım Farkındalıklı Tasarım: Mimari, RepVGG tarzı yeniden parametrelendirilebilir bloklar kullanılarak özellikle GPU'lar olmak üzere çeşitli donanım platformlarında verimli performans için uyarlanmıştır.
- EfficientRep Backbone ve Rep-PAN Neck: Bu yapılar, doğrudan daha hızlı çıkarıma dönüşen hesaplama darboğazlarını ve bellek erişim maliyetlerini azaltmak için tasarlanmıştır.
- Ayrıştırılmış Head (Decoupled Head): Sınıflandırma ve yerelleştirme head'lerini ayırır; bu durumun yakınsamayı ve nihai model doğruluğunu artırdığı gösterilmiştir; bu teknik YOLOX gibi modellerde de görülmektedir.
Güçlü Yönler
- Yüksek Çıkarım Hızı: Hızlı çıkarım için optimize edilmiştir, bu da onu gecikmenin kritik bir faktör olduğu gerçek zamanlı uygulamalar için oldukça uygun hale getirir.
- Endüstriyel Odak: Üretim gibi pratik ortamlarda sağlamlık ve verimlilik sağlayarak, endüstriyel dağıtım senaryoları göz önünde bulundurularak tasarlanmıştır.
- Verimli Tasarım: YOLOv6-3.0'ın daha küçük varyantları çok düşük parametre ve FLOP sayısına sahiptir, bu da onları kaynak kısıtlı ortamlar için ideal kılar.
Zayıflıklar
- Doğruluk Dengesi: Yüksek verimli olmasına rağmen, karmaşık veri kümelerinde, hız yerine maksimum hassasiyete öncelik veren YOLOv7 gibi modellere kıyasla biraz daha düşük doğruluk gösterebilir.
- Ekosistem ve Çok Yönlülük: YOLOv6 etrafındaki ekosistem, Ultralytics modellerinden daha az kapsamlıdır ve öncelikle nesne algılama üzerine odaklanmıştır.
Kullanım Alanları
YOLOv6-3.0, hız ve verimliliğin çok önemli olduğu uygulamalarda öne çıkar:
- Endüstriyel Otomasyon: Üretimde kalite kontrolü ve süreç takibi.
- Gerçek Zamanlı Sistemler: Robotik ve gözetim gibi katı gecikme gereksinimleri olan uygulamalar.
- Edge Computing: Verimli tasarımı nedeniyle kaynak kısıtlı cihazlarda dağıtım. NVIDIA Jetson gibi cihazlara dağıtım kılavuzlarına göz atın.
YOLOv6-3.0 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: YOLOv7 - YOLOv6-3.0
Aşağıdaki tablo, COCO veri kümesindeki YOLOv7 ve YOLOv6-3.0'ın karşılaştırılabilir varyantları için performans metriklerini özetlemektedir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Not: Hız kıyaslamaları donanıma, yazılıma (TensorRT, ONNX, OpenVINO), toplu iş boyutuna ve belirli yapılandırmalara bağlı olarak değişebilir. mAP değerleri tipik olarak COCO val veri kümesinde raporlanır.
Tabloya göre, YOLOv7x en yüksek mAP'ye ulaşarak üstün doğruluk gösterir. Bununla birlikte, YOLOv6-3.0 modelleri, özellikle YOLOv6-3.0n gibi daha küçük varyantlar, özellikle GPU'da TensorRT optimizasyonu ile önemli ölçüde daha hızlı çıkarım hızları sunar ve daha az parametreye ve FLOP'a sahiptir, bu da onları oldukça verimli kılar. Seçim, önceliğin maksimum doğruluk (YOLOv7) mu yoksa optimum hız/verimlilik (YOLOv6-3.0) mi olduğuna bağlıdır.
Neden Ultralytics YOLO Modellerini Seçmelisiniz?
Kapsamlı ve kullanımı kolay bir ekosistem içinde son teknoloji modeller arayan kullanıcılar için Ultralytics, YOLOv8 ve en son Ultralytics YOLO11'i sunar. Bu modeller, hem YOLOv7 hem de YOLOv6'ya göre önemli avantajlar sağlar.
- Kullanım Kolaylığı: Ultralytics modelleri, eğitim, doğrulama ve dağıtımı basitleştiren kolaylaştırılmış bir Python API'si, kapsamlı belgelendirme ve anlaşılır CLI komutları ile birlikte gelir.
- İyi Yönetilen Ekosistem: Aktif geliştirmeden, güçlü bir açık kaynak topluluğundan, sık güncellemelerden ve sorunsuz MLOps için Ultralytics HUB gibi araçlarla entegrasyondan yararlanın.
- Performans Dengesi: Ultralytics modelleri, kenar cihazlardan bulut sunucularına kadar çeşitli gerçek dünya senaryoları için uygun olan hız ve doğruluk arasında mükemmel bir denge sağlar.
- Çok Yönlülük: YOLOv8 ve YOLO11 gibi modeller, nesne tespitinin ötesinde segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne tespiti (OBB) dahil olmak üzere birden fazla görevi destekleyerek birleşik bir çözüm sunar.
- Eğitim Verimliliği: Verimli eğitim süreçlerinden, COCO gibi veri kümelerinde kullanıma hazır önceden eğitilmiş ağırlıklardan ve daha hızlı yakınsama sürelerinden yararlanın.
Daha fazla inceleme için, RT-DETR gibi diğer modellerle yapılan karşılaştırmaları da faydalı bulabilirsiniz.