YOLOv7 - YOLOv6-3.0 Karşılaştırması: Kapsamlı Teknik Bir Karşılaştırma
Bilgisayar görüşü alanındaki hızlı gelişmelerde, doğru nesne algılama modelini seçmek proje başarısı için çok önemlidir. Alanı şekillendiren iki önemli çerçeve YOLOv7 ve YOLOv6-3.0'dır. Her ikisi de YOLO (You Only Look Once) soyunu paylaşsa da, mimari felsefeleri ve optimizasyon hedefleri açısından önemli ölçüde farklılaşırlar.
Bu kılavuz, bu iki modelin mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını karşılaştıran derinlemesine bir teknik analizini sunar. Ayrıca, Ultralytics YOLO11 gibi modern alternatiflerin, bu öncüllerin en iyi özelliklerini birleşik, kullanıcı dostu bir ekosistemde nasıl entegre ettiğini inceliyoruz.
YOLOv7: Doğruluğun Mimarisi
Temmuz 2022'de yayınlanan YOLOv7, gerçek zamanlı çıkarım yeteneklerinden ödün vermeden doğruluğu en üst düzeye çıkarmak için mimari yeniliklere öncelik vererek YOLO ailesinde büyük bir değişimi temsil etti. COCO veri kümesi ölçütlerinin sınırlarını zorlamak için tasarlanmıştır.
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Belgeler:https://docs.ultralytics.com/models/yolov7/
Temel Mimari Özellikler
YOLOv7, çıkarım maliyetini artırmadan doğruluğu artıran bir dizi optimizasyon yöntemi olan "eğitilebilir bedava hediyeler" tanıttı.
- E-ELAN (Genişletilmiş-Verimli Katman Toplama Ağları): Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek ağın öğrenme yeteneğini geliştirir. Hesaplama bloklarının kardinalitesini genişleterek modelin daha çeşitli özellikleri öğrenmesini sağlar.
- Model Ölçeklendirme: YOLOv7, derinlik ve genişliği eş zamanlı olarak değiştiren bileşik ölçeklendirme teknikleri kullanarak, farklı model boyutlarında (Tiny'den E6E'ye) optimum performans sağlar.
- Yardımcı Başlık Eğitimi: Model, derin denetim sağlamak için eğitim sırasında yardımcı bir başlık kullanır ve bu daha sonra çıkarım sırasında kaldırılır. Bu, derin öğrenme modelinin yakınsamasını iyileştirir.
Güçlü ve Zayıf Yönler
YOLOv7, özellikle küçük ve kapalı nesnelerde yüksek ortalama Ortalama Hassasiyet (mAP) ile ünlüdür. Hassasiyetin çok önemli olduğu araştırmalar ve senaryolar için mükemmel bir seçimdir. Bununla birlikte, büyük ölçüde birleştirme tabanlı katmanlara dayanan karmaşık mimarisi, modern endüstriyel modellere kıyasla eğitim sırasında daha yüksek bellek tüketimine neden olabilir.
YOLOv7 hakkında daha fazla bilgi edinin
YOLOv6-3.0: Endüstriyel Hız için Tasarlandı
Meituan'daki görsel bilişim departmanı tarafından geliştirilen YOLOv6-3.0, pratik endüstriyel uygulamalara büyük önem vermektedir. 2023'ün başlarında piyasaya sürülen bu sürüm, çıkarım hızına ve donanım verimliliğine öncelik vererek uç bilgi işlem için güçlü bir aday haline gelmektedir.
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv:https://arxiv.org/abs/2301.05586
GitHub:https://github.com/meituan/YOLOv6
Belgeler:https://docs.ultralytics.com/models/yolov6/
Temel Mimari Özellikler
YOLOv6-3.0, özellikle GPU ve CPU verimini optimize eden donanım tabanlı tasarımıyla farklıdır.
- RepVGG Backbone: Model, yeniden parametrelendirme (RepVGG) bloklarını kullanır. Eğitim sırasında, modelin daha iyi öğrenme için çok dallı bir topolojisi vardır ve bu, çıkarım için matematiksel olarak tek dallı bir yapıda birleştirilir. Bu, NVIDIA Jetson gibi donanımlarda daha hızlı yürütme ile sonuçlanır.
- Ayrıştırılmış Kafa (Decoupled Head): Sınıflandırma ve yerelleştirme için özellikleri paylaşan önceki YOLO sürümlerinin aksine, YOLOv6 ayrıştırılmış bir kafa kullanır. Bu ayrım, yakınsama hızını ve detect doğruluğunu artırır.
- Kuantalamaya Uygun: Mimari, kaynak kısıtlı cihazlarda dağıtım için gerekli olan model kuantalamasına (örneğin, INT8) uygun olacak şekilde tasarlanmıştır.
Güçlü ve Zayıf Yönler
YOLOv6-3.0, ham verimde mükemmeldir. Milisaniyelerin önemli olduğu endüstriyel otomasyon hatları veya robotik için optimize edilmiş çıkarım grafiği önemli bir avantajdır. Ancak, odak noktası öncelikle algılamadır ve YOLO11 gibi sonraki yinelemelerde bulunan yerel çoklu görev çok yönlülüğünden yoksundur.
YOLOv6-3.0 hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Aşağıdaki tablo, iki model arasındaki ödünleşimleri göstermektedir. YOLOv6-3.0 genellikle benzer doğruluk seviyeleri için üstün hız sunarken, YOLOv7 algılama hassasiyetinin sınırlarını zorlamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Sonuçların Analizi
- Hız - Doğruluk: YOLOv6-3.0n, T4 GPU'larda 1,17 ms çıkarım elde ederek aşırı hız için öne çıkıyor ve bu da onu yüksek hızlı video analizi için ideal hale getiriyor.
- En Yüksek Doğruluk: YOLOv7x, YOLOv6-3.0l'ye (%52,8) kıyasla daha yüksek bir mAP (%53,1) elde ederek zor örnekleri detect etmedeki gücünü sergiler.
- Hesaplama Verimliliği: YOLOv6, karşılaştırılabilir performans seviyeleri için daha az FLOPs kullanır ve "EfficientRep" tasarım felsefesini doğrular.
Dağıtım Hususları
Kıyaslamalar bir temel sağlarken, gerçek dünya performansı büyük ölçüde dağıtım donanımına bağlıdır. YOLOv6'nın yeniden parametrelendirilmesi GPU'larda parlarken, YOLOv7'nin birleştirme tabanlı mimarisi sağlamdır ancak bellek bant genişliği yoğun olabilir.
Ultralytics'in Avantajı: Karşılaştırmanın Ötesinde
YOLOv7 ve YOLOv6-3.0, bilgisayar görüşü tarihinde önemli başarıları temsil etse de, alan hızla ilerliyor. Sürdürülebilir, geleceğe dönük bir çözüm arayan geliştiriciler için Ultralytics YOLO11, bireysel model mimarilerinin sınırlamalarının yerine geçen kapsamlı bir ekosistem sunar.
Neden Ultralytics YOLO11'i Seçmelisiniz?
- Rakipsiz Kullanım Kolaylığı: Karmaşık depo klonlama ve ortam kurulumu gerektiren birçok açık kaynaklı modelin aksine, Ultralytics modellerine basit bir pip kurulumuyla erişilebilir. Python API tasarımı sezgiseldir ve yalnızca birkaç satır kodla eğitim ve çıkarıma olanak tanır.
- Performans Dengesi: YOLO11, hem YOLOv6 hem de YOLOv7'nin mimari dersleri üzerine inşa edilmiştir. Gerçek zamanlı uygulamalar için gereken çıkarım hızlarını korurken son teknoloji ürünü doğruluğa ulaşan gelişmiş bir mimari kullanır.
- Çok Yönlülük: Ultralytics ekosisteminin en güçlü avantajlarından biri, çoklu görevler için sunduğu destektir. YOLOv6 ve YOLOv7 öncelikle algılamaya odaklanırken, YOLO11 yerel olarak Örnek Segmentasyonunu, Poz Tahminini, Sınıflandırmayı ve Yönlendirilmiş Nesne Algılamayı (OBB) destekler.
- Eğitim Verimliliği: Ultralytics modelleri, daha hızlı yakınsama ve eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir. Bu verimli kaynak yönetimi, eski transformatör veya birleştirme ağırlıklı mimarilerle sıklıkla ilişkili olan büyük CUDA bellek yükü olmadan tüketici sınıfı GPU'larda eğitime olanak tanır.
- İyi Yönetilen Ekosistem: Sık güncellemeler, kapsamlı belgeler ve canlı bir topluluk ile Ultralytics, projelerinizin en son PyTorch sürümleri ve ONNX, TensorRT ve CoreML gibi dışa aktarım formatlarıyla uyumlu kalmasını sağlar.
Uygulama Örneği
Ultralytics ile son teknoloji bir modeli dağıtmak oldukça basittir. Nesne algılamayı ne kadar kolay uygulayabileceğiniz aşağıda açıklanmıştır:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for result in results:
result.save(filename="output.jpg") # save to disk
Sonuç
Hem YOLOv7 hem de YOLOv6-3.0 belirli nişlere hizmet eder: YOLOv7 yüksek doğruluklu araştırma görevleri için ve YOLOv6-3.0 endüstriyel hız optimizasyonu için. Ancak, geliştiricilerin ve araştırmacıların çoğu için Ultralytics YOLO11 ekosistemi en dengeli, çok yönlü ve sürdürülebilir çözümü sağlar. Yüksek performansı olağanüstü bir kullanıcı deneyimi ve geniş görev desteğiyle birleştiren Ultralytics, kullanıcıların model mimarileriyle uğraşmak yerine gerçek dünya sorunlarını çözmeye odaklanmalarını sağlar.
Diğer Modelleri İnceleyin
Bilgisayar görüşü alanında daha fazla seçenek keşfetmekle ilgileniyorsanız, bu karşılaştırmaları göz önünde bulundurun:
- YOLOv7 - RT-DETR: CNN tabanlı dedektörleri Transformer tabanlı mimarilerle karşılaştırma.
- YOLOv6 - YOLOv8: Ultralytics modellerinin önceki neslinin endüstri standartlarıyla nasıl karşılaştırıldığına bir bakış.
- YOLOv7 - YOLOX: Anchor'suz ve anchor tabanlı algılama stratejilerini analiz etme.