YOLOv6-3.0 ve YOLOv7: Gerçek Zamanlı Nesne detectörlerinin Teknik Analizi
Bilgisayar görüşü uygulamaları için doğru nesne detectör modelini seçmek, genellikle hız, doğruluk ve mimari inceliklerin karmaşık bir manzarasında gezinmeyi gerektirir. Bu evrimin iki önemli kilometre taşı, piyasaya sürüldüklerinde gerçek zamanlı çıkarımda mümkün olanın sınırlarını zorlayan YOLOv6-3.0 ve YOLOv7'dir. Bu kapsamlı karşılaştırma, geliştiricilerin bilinçli kararlar almasına yardımcı olmak için mimari farklılıklarını, performans metriklerini ve ideal dağıtım senaryolarını incelemektedir.
Performansa Genel Bakış
Aşağıdaki tablo, her iki modelin karşılaştırılabilir varyantları için performans metriklerini vurgulamaktadır. Anahtar değerler, belirli konfigürasyonlarda bir modelin diğerine göre nerede avantajlı olabileceğini göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv6-3.0: Endüstriyel Düzeyde Verimlilik
Genellikle "YOLOv6 v3.0" olarak anılan YOLOv6-3.0, Meituan tarafından geliştirilen YOLOv6 serisinde önemli bir yinelemeyi temsil etmektedir. Ocak 2023'te piyasaya sürülen bu sürüm, GPU veriminin kritik olduğu endüstriyel uygulamalara daha iyi hizmet vermek amacıyla mimariyi "yeniden yüklemeye" büyük ölçüde odaklanmıştır.
YOLOv6-3.0 Detayları:
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
- Kuruluş:Meituan
- Tarih: 2023-01-13
- Arxiv:YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
- GitHub:Meituan YOLOv6 Deposu
YOLOv6 hakkında daha fazla bilgi edinin.
Mimari Yenilikler
YOLOv6-3.0, NVIDIA T4 GPU'lar gibi donanım hızlandırıcılarında verimliliği en üst düzeye çıkarmak için tasarlanmış çeşitli önemli iyileştirmeler sunmaktadır:
- Çift Yönlü Birleştirme (BiC): Bu modül, ağın farklı ölçekleri arasında daha iyi bilgi akışını kolaylaştırarak özellik füzyonunu iyileştirir ve değişen mesafelerdeki nesnelerin detect edilmesini artırır.
- Çapa Destekli Eğitim (AAT): Model çıkarımı çapasız kalırken, YOLOv6-3.0 eğitim sırasında yardımcı bir çapa tabanlı dal kullanır. Bu hibrit strateji, çıkarım hızını etkilemeden yakınsamayı stabilize eder ve nihai doğruluğu artırır.
- Yeniden Parametrelendirme: RepVGG tarzı blokları yoğun bir şekilde kullanan model, çıkarım sırasında karmaşık çok dallı yapıları tek yollu evrişimlere basitleştirir. Bu, GPU donanımında önemli hız artışları sağlar.
İdeal Kullanım Senaryoları
Özel optimizasyonları sayesinde YOLOv6-3.0 şunlarda üstündür:
- Üretim Kalite Kontrolü: Verimin (FPS) birincil kısıtlama olduğu montaj hatlarında yüksek hızlı kusur detect etme.
- Lojistik ve Sıralama: Otomatik makine öğrenimi boru hatlarını kullanarak yüksek hacimli dağıtım merkezlerinde paketlerin hızlı bir şekilde tanımlanması.
- Video Analizi: Güvenlik veya perakende içgörüleri için sunucu sınıfı GPU'larda birden fazla video akışının eş zamanlı olarak işlenmesi.
YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi
YOLOv7, Temmuz 2022'de piyasaya sürüldü ve hızla son teknoloji bir detectör olarak kendini kanıtladı. Yazarlar, parametre sayılarını önemli ölçüde artırmadan eğitim verimliliğini ve çıkarım doğruluğunu artıran mimari reformlara odaklanarak bu teknikleri "eğitilebilir bedelsizler (trainable bag-of-freebies)" olarak adlandırdılar.
YOLOv7 Detayları:
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2022-07-06
- Arxiv:YOLOv7: Eğitilebilir ücretsiz ekstralar, yeniState-of-the-art belirliyor
- GitHub:WongKinYiu YOLOv7 Deposu
YOLOv7 hakkında daha fazla bilgi edinin.
Mimari Yenilikler
YOLOv7, sinir ağlarının gradyan bilgisini nasıl öğrendiğini ve yaydığını iyileştiren kavramlar tanıttı:
- E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı): Bu yapı, en kısa ve en uzun gradyan yollarını kontrol ederek ağın, derin ağlarda sıkça görülen gradyan kaybolma problemi olmadan daha çeşitli özellikler öğrenmesini sağlar.
- Model Ölçeklendirme: YOLOv7, birleştirme tabanlı modeller için derinliği ve genişliği eş zamanlı olarak değiştiren bileşik bir ölçeklendirme yöntemi önerdi ve farklı model boyutlarında (Tiny'den E6E'ye) optimum mimariyi sağladı.
- Planlı Yeniden Parametrelendirme: YOLOv6'ya benzer şekilde, yeniden parametrelendirme kullanır ancak hangi modüllerin basitleştirilmesi gerektiğini belirlemek için kesin olarak planlanmış stratejiler uygulayarak artık bağlantıları düz evrişimlerle dengeler.
İdeal Kullanım Senaryoları
YOLOv7 özellikle aşağıdakiler için çok uygundur:
- Ayrıntılı Özellik Çıkarımı: Küçük nesneler üzerindeki ince ayrıntıları (örn. uzaktaki trafik ışıkları) tanımanın kritik öneme sahip olduğu otonom araçlar gibi senaryolar.
- Düşük Güçlü Cihazlarda Kenar Yapay Zeka: YOLOv7-tiny varyantı, mobil dağıtımlar için oldukça etkilidir ve sınırlı donanımda doğruluk ile hız arasında güçlü bir denge sunar.
- Araştırma Temelleri: Şeffaf mimarisi ve kapsamlı ablasyon çalışmaları, onu nöral mimari arama üzerine akademik araştırmalar için favori haline getirir.
Kritik Karşılaştırma: Güçlü ve Zayıf Yönler
YOLOv6-3.0 ve YOLOv7 arasında seçim yaparken, karar genellikle belirli donanım dağıtım hedefine ve görsel görevin niteliğine bağlıdır.
Hız ve Doğruluk Dengesi
YOLOv6-3.0, agresif yeniden parametrelendirmesi ve TensorRT dostu tasarımı sayesinde özel GPU'larda (NVIDIA T4 gibi) genellikle daha yüksek verim elde eder. Örneğin, YOLOv6-3.0l modeli, çok düşük gecikme süresiyle %52,8 mAP başarır. Tersine, YOLOv7 parametre verimliliğine odaklanır. YOLOv7-X modeli, doğruluğu biraz daha yukarı çeker (%53,1 mAP) ancak daha büyük bir parametre sayısı ve daha yüksek hesaplama karmaşıklığı (FLOPs) ile kenar cihazlarda gecikmeyi etkileyebilir.
Eğitim Metodolojisi
YOLOv6-3.0'ın "Çapa Destekli Eğitim"i, eğitimi stabilize eden ancak eğitim hattı koduna karmaşıklık katan benzersiz bir özelliktir. YOLOv7'nin saf "bedava ekstralar" yaklaşımı, eğitim döngüsünü bir ölçüde standart tutar ancak E-ELAN gibi karmaşık mimari tanımlamalara dayanır. Özel eğitimle uğraşan geliştiriciler, YOLOv6'nın yardımcı başlıklarını yakınsama hızı için faydalı bulabilir.
Dağıtım Hususları
Dağıtım ortamınız kesinlikle NVIDIA GPU tabanlıysa (örn. bulut sunucuları veya Jetson cihazları), YOLOv6-3.0 genellikle dolar başına daha iyi FPS sağlar. Ancak, kapsamlı ayarlama gerektirmeden çeşitli donanımlarda (CPU'lar, NPU'lar) iyi genelleşebilen bir modele ihtiyacınız varsa, YOLOv7 veya daha yeni Ultralytics modelleri genellikle daha esnektir.
Ultralytics'in Avantajı
YOLOv6 ve YOLOv7 mükemmel modeller olsa da, onları Ultralytics ekosistemi içinde kullanmak, tüm makine öğrenimi yaşam döngüsünü kolaylaştıran belirgin avantajlar sağlar.
- Birleşik API: Ultralytics python paketi, farklı mimarilerin karmaşıklığını soyutlar. Kodunuzda tek bir dizeyi değiştirerek YOLOv6, YOLOv7 ve YOLO26 gibi daha yeni modeller arasında geçiş yapabilirsiniz.
- İyi Yönetilen Ekosistem: Genellikle pasif kalan araştırma depolarının aksine, Ultralytics, PyTorch, CUDA ve python'ın en son sürümleriyle uyumluluğu sağlar.
- Çok Yönlülük: Ultralytics, yalnızca detect'in ötesinde, örnek segmentasyon, poz tahmini ve yönlendirilmiş nesne detect (obb) dahil olmak üzere geniş bir görev yelpazesini destekler.
- Bellek Verimliliği: Ultralytics uygulamaları, eğitim sırasında daha düşük VRAM kullanımı için optimize edilmiştir, bu da ham araştırma kod tabanlarının genellikle gerektirdiği yüksek bellek ayak izinin aksine, tüketici sınıfı GPU'larda güçlü modelleri eğitmeyi mümkün kılar.
Son Teknolojiye İlerleme: YOLO26
Mutlak en iyi performansı ve kullanım kolaylığını arayan geliştiriciler için, yakın zamanda piyasaya sürülen YOLO26, önemli mimari atılımlarla önceki YOLO'ların mirası üzerine inşa edilmiştir.
Ocak 2026'da piyasaya sürülen YOLO26, kesin "öncelikli kenar" modeli olarak tasarlanmıştır. Yerel bir Uçtan Uca NMS'siz Tasarım özelliğine sahiptir, bu da Maksimum Olmayan Bastırma (Non-Maximum Suppression) sonrası işlemine olan ihtiyacı ortadan kaldırır. Bu, önceki nesillere göre %43'e kadar daha hızlı olan önemli ölçüde daha hızlı CPU çıkarımına olanak tanır ve hassas hiperparametreleri kaldırarak dağıtım hatlarını basitleştirir.
YOLO26 hakkında daha fazla bilgi edinin
Ayrıca, YOLO26, LLM eğitim tekniklerinden esinlenen hibrit bir yapı olan MuSGD Optimize Edici'yi kullanır, bu da istikrar ve hızlı yakınsama sağlar. DFL kaldırma ile model, geniş cihaz uyumluluğu için ONNX veya TensorRT gibi formatlara dışa aktarılması daha kolaydır.
Kod Örneği
Bu modelleri Ultralytics ile çalıştırmak basittir. Aşağıdaki örnek, önceden eğitilmiş bir modeli nasıl yükleyeceğinizi ve bir görüntü üzerinde çıkarım yapacağınızı göstermektedir:
from ultralytics import YOLO
# Load a YOLOv6, YOLOv7, or the recommended YOLO26 model
model = YOLO("yolov6n.yaml") # or "yolov7.pt" or "yolo26n.pt"
# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Sonuç
Hem YOLOv6-3.0 hem de YOLOv7, gerçek zamanlı nesne detect'ini ilerletmede önemli roller oynadı. YOLOv6-3.0, GPU verimi için mimariyi optimize etti ve endüstriyel uygulamalar için güçlü bir aday haline geldi. YOLOv7, özellik toplama ve gradyan akışının sınırlarını zorlayarak karmaşık sahneler için sağlam performans sundu.
Ancak, alan hızla ilerliyor. Ultralytics Platformu'ndan yararlanarak, geliştiriciler bu modellere en son teknoloji YOLO26 ile birlikte erişebilir, böylece iş için her zaman en iyi araca sahip olmalarını sağlar. YOLOv6'nın ham GPU hızını mı yoksa YOLOv7'nin mimari zekasını mı önceliklendirirseniz, Ultralytics API'si onları tek, güçlü bir iş akışında birleştirir.
İlgili modellerin daha fazla keşfi için, YOLOv8, YOLOv9 ve YOLO11 belgelerini incelemeyi düşünebilirsiniz.