YOLOv6.0 ile YOLOv9: Yüksek Performanslı Nesne Algılamada Gelişmeler
Nesne algılama mimarilerinin evrimi, çıkarım hızı ve algılama doğruluğu arasında optimum dengeyi sürekli olarak aramakla şekillenmiştir. Bu karşılaştırma, Meituan tarafından geliştirilen sağlam bir endüstriyel sınıf model olan YOLOv6.YOLOv6 ve YOLOv9'yi derinlemesine incelemektedir. Bu model, gradyan bilgi yönetiminde yeni kavramlar getiren araştırma odaklı bir mimaridir. Mimari yapılarını, performans ölçütlerini ve ideal kullanım örneklerini analiz ederek, geliştiriciler bilgisayar görme süreçleri için bilinçli kararlar alabilirler.
Performans Metrikleri Karşılaştırması
Aşağıdaki tablo, temel performans göstergelerinin doğrudan karşılaştırmasını sunmaktadır. YOLOv9 genel olarak benzer model boyutları için daha yüksek doğruluk (mAP) sunarken, YOLOv6.YOLOv6 belirli GPU ortamlarda rekabet gücünü korumaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv6.0: Endüstriyel Hassasiyet
YOLOv6, özellikle 3.0 sürümü, donanım dağıtımında genellikle NVIDIA T4 gibi GPU'ların kullanıldığı endüstriyel uygulamalara odaklanarak tasarlanmıştır. Kuantizasyon ve TensorRT için agresif optimizasyon yoluyla dağıtım kolaylığını vurgular.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
- Kuruluş:Meituan
- Tarih: 2023-01-13
- Arxiv:YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
- GitHub:meituan/YOLOv6
Mimari ve Güçlü Yönler
YOLOv6.YOLOv6, yapısal yeniden parametreleştirme kullanan EfficientRep olarak bilinen RepVGG tarzı bir backbone kullanır. Eğitim sırasında model, karmaşık özellikleri öğrenmek için çok dallı bloklar kullanır, ancak çıkarım sırasında bunlar tek bir $3\times3$ konvolüsyona dönüşür. Bu mimari, GPU son derece uyumludur, bellek verimini en üst düzeye çıkarır ve gecikmeyi azaltır.
Temel özellikler şunları içerir:
- Çift yönlü füzyon: Farklı ölçekler arasında özellik yayılımını geliştirerek, farklı boyutlardaki nesnelerin algılanmasını iyileştirir.
- Anchor-Aided Training (AAT): Eğitim sırasında yakınsamayı stabilize etmek için çapa tabanlı ve çapa içermeyen paradigmaların faydalarını birleştirir.
- Kuantizasyon Hazırlığı: Üretim otomasyonunda uç AI cihazları için kritik bir gereklilik olan INT8'e kuantize edildiğinde doğruluk kaybını en aza indirecek şekilde özel olarak tasarlanmıştır.
YOLOv6 hakkında daha fazla bilgi edinin.
YOLOv9: Bilgi Darboğazlarını Ele Alma
YOLOv9 derin öğrenmenin verimliliğini artırmak için teorik bir yaklaşım benimser ve derin ağlardan geçerken verilerin kaybolduğu "bilgi darboğazı" sorununu ele alır. Eğitim süreci boyunca kritik gradyan bilgilerini korumak için mekanizmalar sunar.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arxiv:YOLOv9: Programlanabilir Gradyan Bilgisi Kullanarak Ne Öğrenmek İstediğinizi Öğrenme
- GitHub:WongKinYiu/yolov9
Mimari ve Güçlü Yönler
YOLOv9 temel yeniliği iki ana bileşende YOLOv9 :
- GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı): CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre verimliliğini ve hesaplama hızını en üst düzeye çıkaran yeni bir mimari. Modelin, önceki nesillere kıyasla daha az parametre ile daha sağlam özellikleri öğrenmesini sağlar. YOLOv8gibi önceki nesillere kıyasla daha az parametre ile daha sağlam özellikleri öğrenmesini sağlar.
- PGI (Programlanabilir Gradyan Bilgisi): Ağın derin katmanlarının eğitim sırasında güvenilir gradyan bilgisi almasını sağlayan yardımcı bir denetim çerçevesi. Bu, tıbbi görüntü analizi gibi yüksek hassasiyet gerektiren görevler için özellikle faydalıdır.
YOLOv9 , parametre verimliliği açısından üstün performans YOLOv9 ve birçok rakibinden daha az parametre mAP daha yüksek mAP elde eder, bu da onu model ağırlığı boyutunun bir kısıtlama olduğu araştırma ve senaryolar için mükemmel bir seçim haline getirir.
YOLOv9 hakkında daha fazla bilgi edinin.
Teknik Karşılaştırma ve Kullanım Örnekleri
YOLOv6. YOLOv6 ve YOLOv9 arasında seçim YOLOv9 belirli donanım hedefi ve uygulamanın niteliğine bağlıdır.
Ne Zaman YOLOv6-3.0 Seçmeli
YOLOv6.YOLOv6, GPU ortamlarda üstün performans gösterir. RepVGG backbone paralel işleme için optimize backbone , bu da TensorRT kullanıldığında NVIDIA veya Jetson Orin gibi cihazlarda daha hızlı çalışmasını sağlar. Aşağıdakiler için idealdir:
- Yüksek Hızlı Üretim: Verimliliğin kritik öneme sahip olduğu montaj hatlarında kalite kontrol sistemleri.
- Video Analizi: Akıllı şehir uygulamalarında birden fazla video akışını aynı anda işleme.
- Eski Entegrasyon: RepVGG tarzı mimariler için zaten optimize edilmiş sistemler.
YOLOv9 Ne Zaman Tercih Edilmeli?
YOLOv9 , doğruluğun kritik olduğu uygulamalar ve araştırmalar için tercih YOLOv9 . Gelişmiş mimarisi, birçok öncülünden daha iyi bir şekilde ince ayrıntıları korur. Aşağıdakiler için uygundur:
- Akademik Araştırma: Özellik toplama ve gradyan akışını incelemek için güçlü bir temel.
- Küçük Nesne Algılama: PGI çerçevesi, derin katmanlarda kaybolabilecek küçük hedefler hakkındaki bilgilerin korunmasına yardımcı olur ve bu, hava görüntülerinde yararlıdır.
- Parametre Kısıtlı Cihazlar: Depolama alanı sınırlı olduğunda, YOLOv9 yüksek doğruluk-parametre oranı avantajlıdır.
Dağıtım Esnekliği
Her iki modelin de belirli güçlü yönleri olsa da, bunları dağıtım için dönüştürmek karmaşıklık açısından farklılık gösterebilir. YOLOv6 yeniden parametrelendirme adımı, dışa aktarım sırasında dikkatli bir şekilde ele alınmasını gerektirirken, YOLOv9 PGI için yardımcı dalları, çıkarım sırasında kaldırılır ve bu da nihai model yapısını basitleştirir.
Ultralytics Ekosisteminin Avantajı
YOLOv6 YOLOv9 önemli kilometre taşları YOLOv9 da, Ultralytics ekosistemi, makine öğreniminin tüm yaşam döngüsünü basitleştiren birleşik bir platform sunar. YOLOv6, YOLOv9 veya son teknoloji YOLO26 kullanıyor olun, Ultralytics tutarlı ve güçlü bir deneyim Ultralytics .
Neden Ultralytics ile Geliştirme Yapmalı?
- Kullanım Kolaylığı: Ultralytics Python , karmaşık eğitim döngülerini birkaç satırlık kodla özetler. Model adı dizesini değiştirerek mimariler arasında geçiş yapabilirsiniz, örneğin
yolov6n.ptiçinyolo26n.pt. - İyi Bakımlı Ekosistem: Yayınlandıktan sonra genellikle atıl kalan araştırma depolarının aksine, Ultralytics aktif olarak bakımdan geçirilir. Bu, en son sürümlerle uyumluluğu sağlar. PyTorch, CUDA ve ONNXgibi dışa aktarım formatlarıyla uyumluluğu sağlar.
- Çok yönlülük: Ultralytics , çok çeşitli bilgisayar görme görevlerini Ultralytics . YOLOv6 YOLOv9 algılamaya odaklanırken, Ultralytics yeteneklerini örnek segmentasyonu, poz tahmini ve yönlendirilmiş nesne algılama (OBB) alanlarına da Ultralytics .
- Eğitim Verimliliği: Ultralytics boru hatları bellek verimliliği için optimize edilmiştir, böylece geliştiriciler bellek tüketen dönüştürücü hibritlerine kıyasla tüketici sınıfı GPU'larda daha büyük modeller eğitebilirler.
Kod Örneği: Kesintisiz Eğitim
Ultralytics içinde bu modellerden herhangi birini eğitmek aynıdır, bu da ekibinizin öğrenme eğrisini azaltır.
from ultralytics import YOLO
# Load a model: Switch between 'yolov6n.pt', 'yolov9c.pt', or 'yolo26n.pt'
model = YOLO("yolo26n.pt")
# Train on a dataset (e.g., COCO8)
# The system handles data augmentation, logging, and checkpointing automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
YOLO26'ya yükseltin: Yeni Nesil
Performans, verimlilik ve dağıtım kolaylığı açısından en iyisini arayan geliştiriciler için YOLO26, YOLO zirvesini temsil ediyor. Ocak 2026'da piyasaya sürülen bu ürün, YOLOv6, YOLOv9 ve YOLOv10 'dan alınan derslere dayanarak üstün bir deneyim sunar.
YOLO26'nın Temel Avantajları
- Uçtan Uca NMS Tasarım: Non-Maximum Suppression (NMS) son işlem gerektiren YOLOv6 YOLOv9 farklı olarak, YOLO26 doğal olarak uçtan uca bir tasarımdır. Bu, gecikme değişkenliğini ortadan kaldırır ve özellikle uç cihazlarda dağıtım süreçlerini basitleştirir.
- MuSGD Optimizer: LLM eğitimindeki yeniliklerden esinlenen MuSGD Optimizer ( SGD Muon'un bir karışımı), eğitimi stabilize eder ve yakınsamayı hızlandırarak özel modelleri eğitmek için gereken zamanı ve hesaplama kaynaklarını azaltır.
- Kenar Optimize Edilmiş Performans: Dağıtım Odak Kaybı (DFL) ve mimari iyileştirmelerin kaldırılmasıyla YOLO26, önceki nesillere kıyasla %43'e kadar daha hızlı CPU ulaşır. Bu da onu Raspberry Pi veya cep telefonları gibi CPU ortamlar için ideal bir seçim haline getirir.
- Gelişmiş Kayıp Fonksiyonları: ProgLoss ve STAL'ın entegrasyonu, küçük nesnelerin tanınmasını ve sınırlayıcı kutunun hassasiyetini önemli ölçüde iyileştirerek, önceki YOLO yaygın zayıflıkları giderir.
- Göreve Özel Ustalık: YOLO26 sadece algılama için değildir; segmentasyon görevleri için Semantik segmentasyon kaybı ve yüksek doğrulukta poz tahmini için Artık Log-Olasılık Tahmini (RLE) gibi özel iyileştirmeler içerir.
Sonuç
Hem YOLOv6. YOLOv6 hem de YOLOv9 , belirli nişler için belirgin avantajlar YOLOv9 :YOLOv6 , GPU endüstri boru hatlarıYOLOv6 ; YOLOv9 ise yüksek doğruluklu araştırmalar YOLOv9 . Ancak, tüm donanım türlerinde hız, doğruluk ve dağıtım kolaylığı arasında denge sağlayan, geleceğe dönük bir çözüm için Ultralytics , modern bilgisayar görme geliştirme için önerilen seçim olarak öne çıkıyor.