YOLOv6-3.0 ve YOLOv9: Modern Nesne Algılamaya Teknik Bir Bakış

Gerçek zamanlı nesne algılama dünyası; daha yüksek doğruluk, daha düşük gecikme ve daha iyi donanım kullanımı talepleriyle gelişmeye devam ediyor. Bu kapsamlı karşılaştırma, alandaki iki önemli dönüm noktasını incelemektedir: endüstriyel iş hacmi için geliştirilen YOLOv6-3.0 ve derin öğrenme bilgi darboğazlarını aşmak için yeni mimariler sunan YOLOv9.

Her iki model de benzersiz mimari yenilikler sunsa da, performans ve dağıtım kolaylığı arasında mükemmel dengeyi arayan geliştiriciler genellikle modern ekosistemlere geçiş yapmaktadır. Yeni projelere başlayanlar için, yerel olarak uçtan uca olan Ultralytics YOLO26 önerilen standarttır ve önemli ölçüde daha akıcı bir geliştirici deneyimiyle son teknoloji doğruluk sunar.

YOLOv6-3.0: Endüstriyel İş Hacmi Optimizasyonu

Meituan Vision AI Departmanı tarafından geliştirilen YOLOv6-3.0, özellikle GPU donanımında endüstriyel uygulamalar için maksimum iş hacmi hedefiyle yoğun bir şekilde tasarlanmıştır.

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
  • Kuruluş: Meituan
  • Tarih: 13 Ocak 2023
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Mimari Yenilikler

YOLOv6-3.0, özellik füzyonunu ve donanım verimliliğini artırmak için birçok önemli değişiklik getirmiştir. Mimari, boyun kısmında daha doğru yerelleştirme sinyalleri sağlayan bir Çift Yönlü Birleştirme (BiC) modülünü içerir. Ayrıca, Çapa Destekli Eğitim (AAT) stratejisini kullanır. Bu yaklaşım, çapa tabanlı eğitimin zengin rehberliğini çapasız bir paradigmanın çıkarım hızıyla birleştirerek, dağıtımı yavaşlatmadan daha iyi performans sağlar.

Ana omurga, GPU çıkarımı için donanım dostu olacak şekilde titizlikle optimize edilmiş bir EfficientRep tasarımına dayanır. Bu, ağır toplu işlemlerin standart olduğu endüstriyel üretim senaryoları için onu oldukça yetenekli kılar.

Güçlü ve Zayıf Yönler

YOLOv6-3.0'ın temel gücü, NVIDIA T4 gibi GPU'larda yüksek kare hızı sunmasıdır, bu da onu yüksek yoğunluklu video anlama akışları için uygun hale getirir. Ancak, belirli donanım optimizasyonlarına olan yoğun bağımlılığı, sadece CPU kullanan uç cihazlarda beklenen performansın altında gecikmeye neden olabilir. Ayrıca, eğitim hattını kurmak, daha birleşik çerçevelere kıyasla karmaşık olabilir.

YOLOv6 hakkında daha fazla bilgi edinin

YOLOv9: Programlanabilir Gradyan Bilgisi

Bir yıl sonra piyasaya sürülen YOLOv9, derin sinir ağlarında doğal olarak bulunan bilgi darboğazı sorununu çözmeye odaklanarak CNN mimarilerinin teorik sınırlarını zorlar.

Mimari Yenilikler

YOLOv9'un en büyük katkısı, verilerin ağ katmanlarından geçerken önemli bilgilerin korunmasını sağlayan ve daha güvenilir ağırlık güncellemelerine izin veren Programlanabilir Gradyan Bilgisi (PGI)'dır. PGI'nın yanı sıra, model Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) özelliğine sahiptir. GELAN, parametre verimliliğini maksimize ederek YOLOv9'un birçok selefinden daha az hesaplamalı FLOP ile üstün doğruluk elde etmesini sağlar.

Güçlü ve Zayıf Yönler

YOLOv9, COCO gibi kıyaslama veri kümelerinde olağanüstü bir ortalama Hassasiyet (mAP) elde eder, bu da onu ham doğruluğa öncelik veren araştırmacılar için favori kılar. Ancak, YOLOv6 gibi, işleme sonrası için hala geleneksel Maksimum Olmayanı Bastırma (NMS) yöntemine güvenir. Bu durum gecikmeyi artırır ve özellikle ONNX veya TensorRT gibi formatlar kullanılarak uç cihazlara taşınırken model dağıtım hattını karmaşıklaştırır.

YOLOv9 hakkında daha fazla bilgi edin

Performans Karşılaştırması

Bu modelleri karşılaştırırken, doğruluk, parametre sayısı ve çıkarım hızı arasındaki dengeye bakmak önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Ultralytics Avantajı: YOLO26 ile Tanışın

YOLOv6-3.0 ve YOLOv9 sağlam mimariler sunsa da, üretim ortamları iyi bakılan bir ekosistem, düşük bellek gereksinimleri ve olağanüstü kullanım kolaylığı talep eder. İşte Ultralytics Platform ve YOLO11 ile çığır açan YOLO26 gibi modellerin öne çıktığı nokta budur.

2026'nın başlarında piyasaya sürülen YOLO26, eski darboğazları ortadan kaldırarak dağıtım verimliliğini temelden yeniden tanımlar.

Yerel Uçtan Uca Tasarım

YOLO26, işleme sonrası için Maksimum Olmayanı Bastırma (NMS) ihtiyacını tamamen ortadan kaldıran Uçtan Uca NMS'siz Tasarım özelliğine sahiptir. Bu, çıkarım gecikmesi değişkenliğini önemli ölçüde azaltır ve uç dağıtım mantığını basitleştirir.

Önemli YOLO26 Yenilikleri

  1. MuSGD Optimize Edici: LLM eğitiminden (Moonshot AI'nın Kimi K2'si gibi) esinlenen YOLO26, SGD ve Muon'un bir hibritini kullanır. Bu, bilgisayarlı görü görevlerine benzersiz bir eğitim kararlılığı ve daha hızlı yakınsama getirir.
  2. %43'e Kadar Daha Hızlı CPU Çıkarımı: YOLOv6'nın yoğun GPU odaklı yapısının aksine, YOLO26 uç cihazlar için ağır şekilde optimize edilmiştir. Dağılım Odaklı Kaybın (DFL) kaldırılması, baş kısmını basitleştirerek düşük güçlü CPU'lar ve uç bilişim donanımıyla oldukça uyumlu hale getirir.
  3. ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, hava görüntüleri ve robotik için kritik olan küçük nesne algılamayı önemli ölçüde iyileştirir.
  4. Eşsiz Çok Yönlülük: YOLOv6 tamamen bir algılama motoruyken, YOLO26 örnek segmentasyonu, sınıflandırma, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamasını sorunsuz bir şekilde gerçekleştirir.

YOLO26 hakkında daha fazla bilgi edin

Ultralytics ile Sorunsuz Eğitim

Son teknoloji modelleri eğitmek karmaşık bash betikleri gerektirmemelidir. Ultralytics Python API, otomatik veri yükleme, minimum CUDA bellek kullanımı ve dahili takip ile akıcı bir deneyim sunar.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX with a single command
model.export(format="onnx")

İdeal Kullanım Durumları

Doğru mimariyi seçmek tamamen hedef dağıtım ortamına bağlıdır:

  • YOLOv6-3.0'ı şunlar için kullan: Sunucu sınıfı GPU'ların (örneğin A100'ler) bol olduğu ve toplu işlemlemenin iş hacmini maksimize ettiği fabrika otomasyonu ve kusur tespiti.
  • YOLOv9'u şunlar için kullan: Akademik araştırmalar veya COCO gibi standart veri kümelerinde mutlak en yüksek mAP'i elde etmenin birincil hedef olduğu yarışmalar.
  • Use YOLO26 for: Almost all modern commercial applications. Its NMS-free architecture, low memory footprint, and high-speed CPU inference make it perfect for security alarm systems, smart retail, and real-time object tracking on embedded devices.

Kapsamlı Ultralytics ekosisteminden yararlanarak, geliştiriciler özel gerçek dünya zorlukları için mükemmel performans dengesini bulmak adına YOLOv8, YOLO11 ve YOLO26 ile kolayca denemeler yapabilirler.

Yorumlar