YOLOv6.0 ile YOLOv7: Gerçek Zamanlı Nesne Algılayıcılarının Teknik Analizi
Bilgisayar görme uygulamaları için doğru nesne algılama modelini seçmek, genellikle hız, doğruluk ve mimari nüansların karmaşık bir manzarasında gezinmeyi gerektirir. Bu evrimdeki iki önemli dönüm noktası YOLOv6.YOLOv6 ve YOLOv7'dir. Her ikisi de piyasaya sürüldüklerinde gerçek zamanlı çıkarımda mümkün olanın sınırlarını zorlamıştır. Bu kapsamlı karşılaştırma, geliştiricilerin bilinçli kararlar almasına yardımcı olmak için mimari farklılıklarını, performans ölçütlerini ve ideal dağıtım senaryolarını incelemektedir.
Performansa Genel Bakış
Aşağıdaki tablo, her iki modelin karşılaştırılabilir varyantlarının performans ölçütlerini göstermektedir. Anahtar değerler, belirli yapılandırmalarda bir modelin diğerine göre üstünlüğü olabileceği alanları göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv6.0: Endüstriyel Düzeyde Verimlilik
Genellikle "YOLOv6 .0" olarak anılan YOLOv6.YOLOv6, Meituan tarafından geliştirilen YOLOv6 önemli bir yinelemeyi temsil ediyor. Ocak 2023'te piyasaya sürülen bu sürüm, GPU kritik öneme sahip endüstriyel uygulamalara daha iyi hizmet verebilmek için mimarinin "yeniden yüklenmesine" büyük önem verdi.
YOLOv6-3.0 Detayları:
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
- Kuruluş:Meituan
- Tarih: 2023-01-13
- Arxiv:YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
- GitHub:Meituan YOLOv6 Deposu
YOLOv6 hakkında daha fazla bilgi edinin.
Mimari Yenilikler
YOLOv6.YOLOv6, NVIDIA GPU'lar gibi donanım hızlandırıcılarında verimliliği en üst düzeye çıkarmak için tasarlanmış birkaç önemli iyileştirme sunar:
- Çift Yönlü Birleştirme (BiC): Bu modül, ağın farklı ölçekleri arasında daha iyi bilgi akışını kolaylaştırarak özellik birleştirmeyi iyileştirir ve farklı mesafelerdeki nesnelerin algılanmasını geliştirir.
- Anchor-Aided Training (AAT): Model çıkarımında anchor kullanılmamasına rağmen, YOLOv6. YOLOv6 eğitim sırasında yardımcı anchor tabanlı bir dal kullanır. Bu hibrit strateji, çıkarım hızını etkilemeden yakınsamayı stabilize eder ve nihai doğruluğu artırır.
- Yeniden parametreleştirme: RepVGG tarzı blokları yoğun bir şekilde kullanan model, karmaşık çok dallı yapıları, çıkarım sırasında tek yollu konvolüsyonlara basitleştirir. Bu, GPU önemli hız artışları sağlar.
İdeal Kullanım Senaryoları
Özel optimizasyonları sayesinde YOLOv6.0 şu alanlarda üstünlük sağlar:
- Üretim Kalite Kontrolü: Verim (FPS) birincil kısıtlama olan montaj hatlarında yüksek hızlı kusur tespiti.
- Lojistik ve Sıralama: Otomatik makine öğrenimi süreçlerini kullanarak yüksek hacimli dağıtım merkezlerinde paketlerin hızlı bir şekilde tanımlanması.
- Video Analizi: Güvenlik veya perakende sektörüne ilişkin içgörüler elde etmek için sunucu sınıfı GPU'larda birden fazla video akışını aynı anda işleme.
YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi
YOLOv7 , Temmuz 2022'de piyasaya sürüldü ve kısa sürede en gelişmiş algılayıcı olarak kendini kanıtladı. Yazarlar, parametre sayısını önemli ölçüde artırmadan eğitim verimliliğini ve çıkarım doğruluğunu artıran mimari reformlara odaklandılar ve bu teknikleri "eğitilebilir bag-of-freebies" olarak adlandırdılar.
YOLOv7 Detayları:
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2022-07-06
- Arxiv:YOLOv7: Eğitilebilir ücretsiz ekstralar, yeniState-of-the-art belirliyor
- GitHub:WongKinYiu YOLOv7
YOLOv7 hakkında daha fazla bilgi edinin.
Mimari Yenilikler
YOLOv7 , sinir ağlarının öğrenme ve gradyan bilgisini yayma şeklini iyileştiren kavramlar YOLOv7 :
- E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı): Bu yapı, en kısa ve en uzun gradyan yollarını kontrol ederek, ağın derin ağlarda sıklıkla görülen gradyan kaybolma sorunu olmadan daha çeşitli özellikleri öğrenmesini sağlar.
- Model Ölçeklendirme: YOLOv7 , birleştirme tabanlı modeller için derinlik ve genişliği aynı anda değiştiren bileşik bir ölçeklendirme yöntemi YOLOv7 , farklı model boyutları (Tiny'den E6E'ye) arasında optimum mimariyi garanti eder.
- Planlı Yeniden Parametreleştirme: YOLOv6 benzer şekilde, yeniden parametreleştirme kullanır, ancak hangi modüllerin basitleştirilmesi gerektiğini belirlemek için sıkı bir şekilde planlanmış stratejiler uygular ve artık bağlantıları düz konvolüsyonlarla dengeler.
İdeal Kullanım Senaryoları
YOLOv7 özellikle aşağıdakiler için çok uygundur:
- Ayrıntılı Özellik Çıkarma: Küçük nesnelerdeki (örneğin, uzaktaki trafik ışıkları) ince ayrıntıları tanımak çok önemli olan otonom araçlar gibi senaryolar.
- Düşük Güç Tüketimli Cihazlarda Kenar Yapay Zeka: YOLOv7 varyantı, mobil uygulamalar için oldukça etkilidir ve sınırlı donanımlarda doğruluk ve hız arasında güçlü bir denge sunar.
- Araştırma Temelleri: Şeffaf mimarisi ve kapsamlı ablasyon çalışmaları, onu sinir mimarisi araştırmalarına yönelik akademik araştırmalar için favori bir seçenek haline getiriyor.
Eleştirel Karşılaştırma: Güçlü ve Zayıf Yönler
YOLOv6. YOLOv6 ve YOLOv7 arasında seçim yaparken, karar genellikle belirli donanım dağıtım hedefi ve görsel görevin niteliğine bağlıdır.
Hız ve Doğruluk Arasındaki Denge
YOLOv6, agresif yeniden parametrelendirme ve TensorRT tasarımı sayesinde, özel GPU'larda ( NVIDIA gibi) genellikle daha yüksek verim elde eder. Örneğin, YOLOv6.YOLOv6 modeli çok düşük gecikme mAP %52,8 mAP elde eder. Tersine, YOLOv7 parametre verimliliğine odaklanır. YOLOv7 modeli, doğruluğu biraz daha yükseğe çıkarır (53,1% mAP), ancak daha fazla parametre sayısı ve daha yüksek hesaplama karmaşıklığı (FLOP'lar) ile, bu da uç cihazlarda gecikmeyi etkileyebilir.
Eğitim Metodolojisi
YOLOv6.YOLOv6"Anchor-Aided Training" özelliği, eğitimi stabilize eden ancak eğitim boru hattı koduna karmaşıklık katan benzersiz bir özelliktir. YOLOv7 saf "bag-of-freebies" yaklaşımı, eğitim döngüsünü bir dereceye kadar standart tutar, ancak E-ELAN gibi karmaşık mimari tanımlara dayanır. Özel eğitimle uğraşan geliştiriciler, YOLOv6 yardımcı başlıklarının yakınsama hızı açısından YOLOv6 görebilirler.
Dağıtım Hususları
Dağıtım ortamınız tamamen NVIDIA GPUysa (ör. bulut sunucuları veya Jetson cihazları), YOLOv6.YOLOv6 genellikle dolar başına daha iyi FPS sağlar. Ancak, kapsamlı ayarlamalar yapmadan çeşitli donanımlar (CPU'lar, NPU'lar) arasında iyi bir genelleme sağlayan bir modele ihtiyacınız varsa, YOLOv7 veya daha yeni Ultralytics genellikle daha esnektir.
Ultralytics'in Avantajı
YOLOv6 YOLOv7 mükemmel modeller YOLOv7 birlikte, Ultralytics kullanılması, makine öğreniminin tüm yaşam döngüsünü kolaylaştıran belirgin avantajlar sağlar.
- Birleştirilmiş API: Ultralytics Python , farklı mimarilerin karmaşıklığını ortadan kaldırır. Kodunuzdaki tek bir dizeyi değiştirerek YOLOv6, YOLOv7 ve YOLO26 gibi daha yeni modeller arasında geçiş yapabilirsiniz.
- İyi Bakımlı Ekosistem: Sık sık atıl hale gelen araştırma depolarının aksine, Ultralytics en son sürümlerle uyumluluğu Ultralytics PyTorch, CUDA ve Python ile uyumluluk sağlar.
- Çok yönlülük: Ultralytics , algılama dışında, örnek segmentasyonu, poz tahmini ve yönlendirilmiş nesne algılama (OBB) gibi çok çeşitli görevleri Ultralytics .
- Bellek Verimliliği: Ultralytics , eğitim sırasında daha düşük VRAM kullanımı için optimize edilmiştir. Bu sayede, ham araştırma kod tabanlarının genellikle gerektirdiği yoğun bellek kullanımı aksine, tüketici sınıfı GPU'larda güçlü modellerin eğitilmesi mümkün hale gelir.
En Son Teknolojiye Geçiş: YOLO26
En iyi performansı ve kullanım kolaylığını arayan geliştiriciler için, yakın zamanda piyasaya sürülen YOLO26, önceki YOLO'ların mirasını önemli mimari yeniliklerle geliştirmiştir.
2026 yılının Ocak ayında piyasaya sürülen YOLO26, kesin "kenar öncelikli" model olarak tasarlanmıştır. Yerel Uçtan Uca NMS Tasarım özelliği sayesinde, Maksimum Baskılama sonrası işleme ihtiyacını ortadan kaldırır. Bu, önceki nesillere göre %43'e varan oranda daha hızlı CPU olanak tanır ve hassas hiperparametreleri ortadan kaldırarak dağıtım süreçlerini basitleştirir.
YOLO26 hakkında daha fazla bilgi edinin
Ayrıca, YOLO26, LLM eğitim tekniklerinden esinlenen bir hibrit olan MuSGD Optimizer'ı kullanarak istikrar ve hızlı yakınsama sağlar. DFL kaldırma özelliği sayesinde, modelin ONNX veya TensorRT gibi formatlara aktarılması daha kolay hale gelir ve böylece geniş bir cihaz uyumluluğu sağlanır.
Kod Örneği
Ultralytics ile bu modelleri çalıştırmak oldukça Ultralytics . Aşağıdaki örnek, önceden eğitilmiş bir modeli yüklemeyi ve bir görüntü üzerinde çıkarım yapmayı göstermektedir:
from ultralytics import YOLO
# Load a YOLOv6, YOLOv7, or the recommended YOLO26 model
model = YOLO("yolov6n.yaml") # or "yolov7.pt" or "yolo26n.pt"
# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Sonuç
Hem YOLOv6.0 hem de YOLOv7 , gerçek zamanlı nesne algılamanın geliştirilmesinde önemli roller oynadı. YOLOv6. YOLOv6, GPU için mimariyi optimize ederek endüstriyel uygulamalar için güçlü bir rakip haline geldi. YOLOv7 , özellik toplama ve gradyan akışının sınırlarını YOLOv7 karmaşık sahneler için sağlam bir performans sundu.
Ancak, bu alan hızla gelişmektedir. Ultralytics kullanarak, geliştiriciler bu modellere en son teknoloji YOLO26 ile birlikte erişebilir ve işleri için her zaman en iyi araca sahip olmalarını sağlayabilirler. YOLOv6 ham GPU YOLOv6 YOLOv7 mimari zekasını YOLOv6 önceliklendirirseniz önceliklendirin, Ultralytics bunları tek bir güçlü iş akışında birleştirir.
İlgili modeller hakkında daha fazla bilgi edinmek için, aşağıdaki belgeleri inceleyebilirsiniz YOLOv8, YOLOv9ve YOLO11.