İçeriğe geç

YOLOv6-3.0 ve YOLOv7: Gerçek Zamanlı Nesne Detect Mimarilerinde Gezinmek

Gerçek zamanlı bilgisayar görüşünün evrimi, mimari verimlilik ve eğitim metodolojilerindeki hızlı gelişmelerle karakterize edilmiştir. Bu alanda önemli etki yaratan iki öne çıkan model YOLOv6-3.0 ve YOLOv7'dir. Her iki çerçeve de çıkarım hızını detect doğruluğuyla dengelemek için yeni teknikler sunmuş, üst düzey sunucu GPU'larından kenar cihazlara kadar çeşitli dağıtımları hedeflemiştir.

Bu kapsamlı teknik karşılaştırma, modern Ultralytics Platformu ve en son YOLO26 modelinin bu temel kavramlar üzerine nasıl inşa edildiğini ve eşsiz geliştirici deneyimleri sunduğunu vurgularken, mimarilerini, performans metriklerini ve ideal kullanım durumlarını inceler.

YOLOv6-3.0: Endüstriyel Verim Optimizasyonu

Meituan'daki Vision AI Departmanı tarafından geliştirilen YOLOv6-3.0, yüksek verimli endüstriyel uygulamalar için özel olarak tasarlanmıştır. Donanım hızlandırıcılarında performansı en üst düzeye çıkarmaya büyük ölçüde odaklanır, bu da onu özel GPU'larda toplu işlemenin mümkün olduğu ortamlar için güçlü bir aday yapar.

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
  • Kuruluş: Meituan
  • Tarih: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Mimari Yenilikler

YOLOv6-3.0, GPU'larda bellek erişim maliyetlerini optimize etmek için tasarlanmış, donanım dostu bir mimari olan EfficientRep backbone'una dayanır. Farklı ölçeklerde özellik füzyonunu artırmak için model, boyun kısmında bir Çift Yönlü Birleştirme (BiC) modülü sunar. Bu, ağın karmaşık uzamsal hiyerarşileri önceki iterasyonlardan daha etkili bir şekilde yakalamasını sağlar.

Ayrıca, YOLOv6-3.0 bir Çapa Destekli Eğitim (AAT) stratejisi uygular. Bu yaklaşım, çapa tabanlı eğitimin zengin gradyan sinyallerini, çapasız çıkarımın kolaylaştırılmış dağıtım avantajlarıyla birleştirerek, modelin işlem sonrası hızdan ödün vermeden daha kararlı bir şekilde yakınsamasına yardımcı olur.

YOLOv6 hakkında daha fazla bilgi edinin.

Donanım Hususları

YOLOv6-3.0, sunucu sınıfı GPU'larda (NVIDIA T4 gibi) üstün performans gösterse de, belirli yapısal yeniden parametrelendirmeye olan yoğun bağımlılığı, yeni mimarilere kıyasla katı CPU'ya bağlı kenar cihazlarda bazen suboptimal gecikmeye yol açabilir.

YOLOv7: 'Bag-of-Freebies' Öncüsü

Academia Sinica'daki araştırmacılar tarafından yayınlanan YOLOv7, çıkarım maliyetini artırmayan gradyan yolu analizi ve eğitim zamanı optimizasyonlarına yoğunlaşarak farklı bir yaklaşım benimsedi; yazarlar bu kavramı "eğitilebilir bir bedava çantası" olarak adlandırıyor.

  • Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
  • Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
  • Tarih: 2022-07-06
  • Arxiv: 2207.02696
  • GitHub: WongKinYiu/yolov7

Mimari Yenilikler

YOLOv7'nin çekirdeği, Genişletilmiş Verimli Katman Agregasyon Ağı (E-ELAN)'dır. E-ELAN, farklı katmanların orijinal ağ topolojisini bozmadan daha çeşitli özellikler öğrenmesine izin vererek gradyan yolunu optimize eder. Bu, en üst düzey ortalama hassasiyet (mAP) elde edebilen oldukça etkileyici bir modelle sonuçlanır.

YOLOv7 ayrıca, çıkarım sırasında evrişimsel katmanları toplu normalleştirme ile birleştirerek model yeniden parametrelendirmesini yoğun bir şekilde kullanır. Bu, NVIDIA TensorRT veya ONNX gibi çerçeveler kullanılarak dağıtıldığında parametre sayısını azaltır ve ileri geçişi hızlandırır.

YOLOv7 hakkında daha fazla bilgi edinin.

Performans Karşılaştırması

Bu modelleri MS COCO veri kümesi üzerinde değerlendirdiğimizde, YOLOv6'nın ultra hafif varyantları ile yoğun parametreli, doğruluk odaklı YOLOv7 mimarileri arasında belirgin bir denge olduğunu gözlemliyoruz.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Veriler, YOLOv6-3.0n'nin olağanüstü çıkarım hızı sunduğunu ve yüksek frekanslı video analizi için uygun olduğunu ortaya koymaktadır. Tersine, YOLOv7x en yüksek mAP değerine ulaşarak, algılama doğruluğunun ham kare hızlarından daha önemli olduğu görevlerde üstünlük sağlamaktadır.

Kullanım Durumları ve Öneriler

YOLOv6 ve YOLOv7 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.

YOLOv6 Ne Zaman Tercih Edilmeli?

YOLOv6, aşağıdaki durumlar için güçlü bir tercihtir:

  • Endüstriyel Donanım Farkındalıklı Dağıtım: Modelin donanım farkındalıklı tasarımının ve verimli yeniden parametrelendirmesinin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
  • Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU üzerinde ham çıkarım hızına öncelik veren uygulamalar.
  • Meituan Ekosistem Entegrasyonu: Halihazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.

YOLOv7 Ne Zaman Tercih Edilmeli?

YOLOv7 için önerilir:

  • Akademik Kıyaslama: 2022 dönemi son teknoloji sonuçlarını yeniden üretmek veya E-ELAN ve eğitilebilir 'bag-of-freebies' tekniklerinin etkilerini incelemek.
  • Yeniden Parametrelendirme Araştırması: Planlı yeniden parametrelendirilmiş evrişimleri ve bileşik model ölçekleme stratejilerini araştırmak.
  • Mevcut Özel İşlem Hatları: YOLOv7'nin özel mimarisi etrafında inşa edilmiş, yoğun şekilde özelleştirilmiş ve kolayca yeniden düzenlenemeyen işlem hatlarına sahip projeler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics Avantajı: Geleceğe Adım Atmak

YOLOv6-3.0 ve YOLOv7 önemli kilometre taşlarını temsil etse de, farklı depoları üretim hatlarına entegre etmek genellikle model dağıtımı ve hiperparametre ayarlamasında zorluklar yaratır. Ultralytics ekosistemi, akıcı ve birleşik bir arayüz sunarak bu sorunları ortadan kaldırır.

Neden Ultralytics'i Seçmelisiniz?

  • Kullanım Kolaylığı: Ultralytics Python API'si, geliştiricilerin yalnızca birkaç satır kodla modelleri yüklemesine, eğitmesine ve dışa aktarmasına olanak tanır. Eski bir modelden en son mimariye geçiş, yalnızca tek bir dizenin değiştirilmesini gerektirir.
  • İyi Yönetilen Ekosistem: Ultralytics, sık güncellemeler, aktif topluluk desteği ve sağlam bir dokümantasyon sunar.
  • Çok Yönlülük: Öncelikli olarak sınırlayıcı kutulara odaklanan önceki modellerin aksine, Ultralytics modelleri, örnek segmentasyon, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere çok görevli öğrenmeyi doğal olarak destekler.
  • Bellek Gereksinimleri: Ultralytics YOLO modelleri, RT-DETR gibi transformatör tabanlı mimarilere kıyasla eğitim sırasında daha düşük bellek kullanımı sağlar, bu da araştırmacıların tüketici sınıfı donanımlarda etkili bir şekilde eğitim yapmasına olanak tanır.

YOLO26'ya Yükseltme

Performansın zirvesini arayan geliştiriciler için, YOLO26 (Ocak 2026'da yayınlandı) nesne algılama paradigmasını temelden değiştiriyor. Karmaşık ön işleme sonrası mantığını ortadan kaldıran ve kenar cihazlarda gecikme varyansını ciddi şekilde azaltan tamamen Uçtan Uca NMS-Serbest Tasarım sunar.

YOLO26'daki temel yenilikler şunlardır:

  • MuSGD Optimizatörü: İnanılmaz derecede kararlı eğitim dinamikleri ve daha hızlı yakınsama sağlayan, SGD ve Muon'un sofistike bir hibritidir.
  • DFL Kaldırma: Dağıtım Odak Kaybını (Distribution Focal Loss) ortadan kaldırarak, YOLO26 dışa aktarma uyumluluğunu basitleştirir ve düşük güçlü cihazlarda performansı artırır.
  • ProgLoss + STAL: Küçük nesne tanımada kayda değer iyileşmeler sağlayan gelişmiş kayıp fonksiyonları.
  • Rakipsiz Hız: Önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı elde ederek, Raspberry Pi veya Apple CoreML dağıtımları gibi gömülü sistemler için mükemmeldir.

Ekosistemdeki diğer yüksek yetenekli modeller arasında YOLO11 ve YOLOv8 bulunmaktadır; her ikisi de eski donanım entegrasyonları için mükemmel performans dengesi sunar.

İş Hattınızı Geleceğe Hazırlayın

Bilgisayar görüşü uygulamalarınızı Ultralytics Platformu üzerinde geliştirerek, veri kümesi yükleyicilerinizi veya dağıtım komut dosyalarınızı yeniden yazmadan gelecekteki en son modellere anında erişim sağlarsınız.

Kod Örneği: Akıcı Eğitim

Aşağıdaki kod parçacığı, Ultralytics API'sini kullanarak en son teknoloji YOLO26 modelini ne kadar zahmetsizce eğitebileceğinizi göstermektedir. Bu aynı iş akışı, genellikle eski depolardan gereken tekrar eden kodu soyutlayarak YOLO11 veya YOLOv8'e sorunsuz bir şekilde uygulanır.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cuda:0",  # Automatically utilizes PyTorch GPU acceleration
)

# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for cross-platform deployment
model.export(format="onnx")

Sonuç

YOLOv6-3.0 ve YOLOv7, gerçek zamanlı algılama zorluğunun farklı yönlerini başarıyla ele aldı. YOLOv6-3.0, özel endüstriyel GPU ortamları için bir güç merkeziyken, YOLOv7 titiz gradyan yolu optimizasyonu aracılığıyla yüksek doğruluk sağlar.

Ancak, eşsiz çok yönlülük, minimum dağıtım sürtünmesi ve en son teknoloji performans gerektiren modern uygulamalar için Ultralytics YOLO26 kesin bir seçim olarak öne çıkmaktadır. NMS-serbest mimarisi, gelişmiş MuSGD optimizatörü ve Ultralytics Platformu ile derin entegrasyonu, geliştiricilerin güçlü, ölçeklenebilir yapay zeka çözümlerini her zamankinden daha hızlı dağıtabilmesini sağlar.


Yorumlar