YOLOv6-3.0 ve YOLOv7: Gerçek Zamanlı Nesne detectörlerinin Teknik Analizi

Bilgisayar görüşü uygulamaları için doğru nesne detectör modelini seçmek, genellikle hız, doğruluk ve mimari inceliklerin karmaşık bir manzarasında gezinmeyi gerektirir. Bu evrimin iki önemli kilometre taşı, piyasaya sürüldüklerinde gerçek zamanlı çıkarımda mümkün olanın sınırlarını zorlayan YOLOv6-3.0 ve YOLOv7'dir. Bu kapsamlı karşılaştırma, geliştiricilerin bilinçli kararlar almasına yardımcı olmak için mimari farklılıklarını, performans metriklerini ve ideal dağıtım senaryolarını incelemektedir.

Performansa Genel Bakış

Aşağıdaki tablo, her iki modelin karşılaştırılabilir varyantları için performans metriklerini vurgulamaktadır. Anahtar değerler, belirli konfigürasyonlarda bir modelin diğerine göre nerede avantajlı olabileceğini göstermektedir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

YOLOv6-3.0: Endüstriyel Düzeyde Verimlilik

Genellikle "YOLOv6 v3.0" olarak anılan YOLOv6-3.0, Meituan tarafından geliştirilen YOLOv6 serisinde önemli bir yinelemeyi temsil etmektedir. Ocak 2023'te piyasaya sürülen bu sürüm, GPU veriminin kritik olduğu endüstriyel uygulamalara daha iyi hizmet vermek amacıyla mimariyi "yeniden yüklemeye" büyük ölçüde odaklanmıştır.

YOLOv6-3.0 Detayları:

Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş:Meituan
Tarih: 2023-01-13
Arxiv:YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
GitHub:Meituan YOLOv6 Deposu

YOLOv6 hakkında daha fazla bilgi edinin.

Mimari Yenilikler

YOLOv6-3.0, NVIDIA T4 GPU'lar gibi donanım hızlandırıcılarında verimliliği en üst düzeye çıkarmak için tasarlanmış çeşitli önemli iyileştirmeler sunmaktadır:

Çift Yönlü Birleştirme (BiC): Bu modül, ağın farklı ölçekleri arasında daha iyi bilgi akışını kolaylaştırarak özellik füzyonunu iyileştirir ve değişen mesafelerdeki nesnelerin detect edilmesini artırır.
Çapa Destekli Eğitim (AAT): Model çıkarımı çapasız kalırken, YOLOv6-3.0 eğitim sırasında yardımcı bir çapa tabanlı dal kullanır. Bu hibrit strateji, çıkarım hızını etkilemeden yakınsamayı stabilize eder ve nihai doğruluğu artırır.
Yeniden Parametrelendirme: RepVGG tarzı blokları yoğun bir şekilde kullanan model, çıkarım sırasında karmaşık çok dallı yapıları tek yollu evrişimlere basitleştirir. Bu, GPU donanımında önemli hız artışları sağlar.

İdeal Kullanım Senaryoları

Özel optimizasyonları sayesinde YOLOv6-3.0 şunlarda üstündür:

Üretim Kalite Kontrolü: Verimin (FPS) birincil kısıtlama olduğu montaj hatlarında yüksek hızlı kusur detect etme.
Lojistik ve Sıralama: Otomatik makine öğrenimi boru hatlarını kullanarak yüksek hacimli dağıtım merkezlerinde paketlerin hızlı bir şekilde tanımlanması.
Video Analizi: Güvenlik veya perakende içgörüleri için sunucu sınıfı GPU'larda birden fazla video akışının eş zamanlı olarak işlenmesi.

YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi

YOLOv7, Temmuz 2022'de piyasaya sürüldü ve hızla son teknoloji bir detectör olarak kendini kanıtladı. Yazarlar, parametre sayılarını önemli ölçüde artırmadan eğitim verimliliğini ve çıkarım doğruluğunu artıran mimari reformlara odaklanarak bu teknikleri "eğitilebilir bedelsizler (trainable bag-of-freebies)" olarak adlandırdılar.

YOLOv7 Detayları:

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arxiv:YOLOv7: Eğitilebilir ücretsiz ekstralar, yeniState-of-the-art belirliyor
GitHub:WongKinYiu YOLOv7 Deposu

YOLOv7 hakkında daha fazla bilgi edinin.

Mimari Yenilikler

YOLOv7, sinir ağlarının gradyan bilgisini nasıl öğrendiğini ve yaydığını iyileştiren kavramlar tanıttı:

E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı): Bu yapı, en kısa ve en uzun gradyan yollarını kontrol ederek ağın, derin ağlarda sıkça görülen gradyan kaybolma problemi olmadan daha çeşitli özellikler öğrenmesini sağlar.
Model Ölçeklendirme: YOLOv7, birleştirme tabanlı modeller için derinliği ve genişliği eş zamanlı olarak değiştiren bileşik bir ölçeklendirme yöntemi önerdi ve farklı model boyutlarında (Tiny'den E6E'ye) optimum mimariyi sağladı.
Planlı Yeniden Parametrelendirme: YOLOv6'ya benzer şekilde, yeniden parametrelendirme kullanır ancak hangi modüllerin basitleştirilmesi gerektiğini belirlemek için kesin olarak planlanmış stratejiler uygulayarak artık bağlantıları düz evrişimlerle dengeler.

İdeal Kullanım Senaryoları

YOLOv7 özellikle aşağıdakiler için çok uygundur:

Ayrıntılı Özellik Çıkarımı: Küçük nesneler üzerindeki ince ayrıntıları (örn. uzaktaki trafik ışıkları) tanımanın kritik öneme sahip olduğu otonom araçlar gibi senaryolar.
Düşük Güçlü Cihazlarda Kenar Yapay Zeka: YOLOv7-tiny varyantı, mobil dağıtımlar için oldukça etkilidir ve sınırlı donanımda doğruluk ile hız arasında güçlü bir denge sunar.
Araştırma Temelleri: Şeffaf mimarisi ve kapsamlı ablasyon çalışmaları, onu nöral mimari arama üzerine akademik araştırmalar için favori haline getirir.

Kritik Karşılaştırma: Güçlü ve Zayıf Yönler

YOLOv6-3.0 ve YOLOv7 arasında seçim yaparken, karar genellikle belirli donanım dağıtım hedefine ve görsel görevin niteliğine bağlıdır.

Hız ve Doğruluk Dengesi

YOLOv6-3.0, agresif yeniden parametrelendirmesi ve TensorRT dostu tasarımı sayesinde özel GPU'larda (NVIDIA T4 gibi) genellikle daha yüksek verim elde eder. Örneğin, YOLOv6-3.0l modeli, çok düşük gecikme süresiyle %52,8 mAP başarır. Tersine, YOLOv7 parametre verimliliğine odaklanır. YOLOv7-X modeli, doğruluğu biraz daha yukarı çeker (%53,1 mAP) ancak daha büyük bir parametre sayısı ve daha yüksek hesaplama karmaşıklığı (FLOPs) ile kenar cihazlarda gecikmeyi etkileyebilir.

Eğitim Metodolojisi

YOLOv6-3.0'ın "Çapa Destekli Eğitim"i, eğitimi stabilize eden ancak eğitim hattı koduna karmaşıklık katan benzersiz bir özelliktir. YOLOv7'nin saf "bedava ekstralar" yaklaşımı, eğitim döngüsünü bir ölçüde standart tutar ancak E-ELAN gibi karmaşık mimari tanımlamalara dayanır. Özel eğitimle uğraşan geliştiriciler, YOLOv6'nın yardımcı başlıklarını yakınsama hızı için faydalı bulabilir.

Dağıtım Hususları

Dağıtım ortamınız kesinlikle NVIDIA GPU tabanlıysa (örn. bulut sunucuları veya Jetson cihazları), YOLOv6-3.0 genellikle dolar başına daha iyi FPS sağlar. Ancak, kapsamlı ayarlama gerektirmeden çeşitli donanımlarda (CPU'lar, NPU'lar) iyi genelleşebilen bir modele ihtiyacınız varsa, YOLOv7 veya daha yeni Ultralytics modelleri genellikle daha esnektir.

Ultralytics'in Avantajı

YOLOv6 ve YOLOv7 mükemmel modeller olsa da, onları Ultralytics ekosistemi içinde kullanmak, tüm makine öğrenimi yaşam döngüsünü kolaylaştıran belirgin avantajlar sağlar.

Birleşik API: Ultralytics python paketi, farklı mimarilerin karmaşıklığını soyutlar. Kodunuzda tek bir dizeyi değiştirerek YOLOv6, YOLOv7 ve YOLO26 gibi daha yeni modeller arasında geçiş yapabilirsiniz.
İyi Yönetilen Ekosistem: Genellikle pasif kalan araştırma depolarının aksine, Ultralytics, PyTorch, CUDA ve python'ın en son sürümleriyle uyumluluğu sağlar.
Çok Yönlülük: Ultralytics, yalnızca detect'in ötesinde, örnek segmentasyon, poz tahmini ve yönlendirilmiş nesne detect (obb) dahil olmak üzere geniş bir görev yelpazesini destekler.
Bellek Verimliliği: Ultralytics uygulamaları, eğitim sırasında daha düşük VRAM kullanımı için optimize edilmiştir, bu da ham araştırma kod tabanlarının genellikle gerektirdiği yüksek bellek ayak izinin aksine, tüketici sınıfı GPU'larda güçlü modelleri eğitmeyi mümkün kılar.

Son Teknolojiye İlerleme: YOLO26

Mutlak en iyi performansı ve kullanım kolaylığını arayan geliştiriciler için, yakın zamanda piyasaya sürülen YOLO26, önemli mimari atılımlarla önceki YOLO'ların mirası üzerine inşa edilmiştir.

Ocak 2026'da piyasaya sürülen YOLO26, kesin "öncelikli kenar" modeli olarak tasarlanmıştır. Yerel bir Uçtan Uca NMS'siz Tasarım özelliğine sahiptir, bu da Maksimum Olmayan Bastırma (Non-Maximum Suppression) sonrası işlemine olan ihtiyacı ortadan kaldırır. Bu, önceki nesillere göre %43'e kadar daha hızlı olan önemli ölçüde daha hızlı CPU çıkarımına olanak tanır ve hassas hiperparametreleri kaldırarak dağıtım hatlarını basitleştirir.

YOLO26 hakkında daha fazla bilgi edinin

Ayrıca, YOLO26, LLM eğitim tekniklerinden esinlenen hibrit bir yapı olan MuSGD Optimize Edici'yi kullanır, bu da istikrar ve hızlı yakınsama sağlar. DFL kaldırma ile model, geniş cihaz uyumluluğu için ONNX veya TensorRT gibi formatlara dışa aktarılması daha kolaydır.

Kod Örneği

Bu modelleri Ultralytics ile çalıştırmak basittir. Aşağıdaki örnek, önceden eğitilmiş bir modeli nasıl yükleyeceğinizi ve bir görüntü üzerinde çıkarım yapacağınızı göstermektedir:

from ultralytics import YOLO

# Load a YOLOv6, YOLOv7, or the recommended YOLO26 model
model = YOLO("yolov6n.yaml")  # or "yolov7.pt" or "yolo26n.pt"

# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Sonuç

Hem YOLOv6-3.0 hem de YOLOv7, gerçek zamanlı nesne detect'ini ilerletmede önemli roller oynadı. YOLOv6-3.0, GPU verimi için mimariyi optimize etti ve endüstriyel uygulamalar için güçlü bir aday haline geldi. YOLOv7, özellik toplama ve gradyan akışının sınırlarını zorlayarak karmaşık sahneler için sağlam performans sundu.

Ancak, alan hızla ilerliyor. Ultralytics Platformu'ndan yararlanarak, geliştiriciler bu modellere en son teknoloji YOLO26 ile birlikte erişebilir, böylece iş için her zaman en iyi araca sahip olmalarını sağlar. YOLOv6'nın ham GPU hızını mı yoksa YOLOv7'nin mimari zekasını mı önceliklendirirseniz, Ultralytics API'si onları tek, güçlü bir iş akışında birleştirir.

İlgili modellerin daha fazla keşfi için, YOLOv8, YOLOv9 ve YOLO11 belgelerini incelemeyi düşünebilirsiniz.

YOLOv6-3.0 ve YOLOv7: Gerçek Zamanlı Nesne detectörlerinin Teknik Analizi

Performansa Genel Bakış

YOLOv6-3.0: Endüstriyel Düzeyde Verimlilik

Mimari Yenilikler

İdeal Kullanım Senaryoları

YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi

Mimari Yenilikler

İdeal Kullanım Senaryoları

Kritik Karşılaştırma: Güçlü ve Zayıf Yönler

Hız ve Doğruluk Dengesi

Eğitim Metodolojisi

Ultralytics'in Avantajı

Son Teknolojiye İlerleme: YOLO26

Kod Örneği

Sonuç

Yorumlar