İçeriğe geç

YOLOv9 ile YOLOv6-3.0 Karşılaştırması: Kapsamlı Bir Teknik Analiz

Gerçek zamanlı nesne detect etmenin evrimi, çıkarım hızı, doğruluk ve hesaplama verimliliği arasındaki hassas dengeyi optimize eden sinir ağı mimarilerindeki sürekli yeniliklerle yönlendirilmiştir. Geliştiriciler ve araştırmacılar, bilgisayar görüşü çerçevelerinin kalabalık ortamında ilerlerken, doğru aracı seçmek için önde gelen mimarileri karşılaştırmak esastır.

Bu teknik kılavuz, derin öğrenme bilgi korumasıyla bilinen YOLOv9 ile endüstriyel uygulamalar için özel olarak tasarlanmış bir model olan YOLOv6-3.0 arasında derinlemesine bir karşılaştırma sunmaktadır.

YOLOv9 Genel Bakış: Özellik Korumasını En Üst Düzeye Çıkarma

2024'ün başlarında tanıtılan YOLOv9, derin sinir ağlarındaki en kalıcı zorluklardan biri olan ileri besleme süreci sırasındaki bilgi kaybını ele almaktadır. Gradyanların güvenilir olmasını ve özellik haritalarının kritik verileri korumasını sağlayarak, teorik doğruluğun sınırlarını zorlar.

  • Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
  • Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
  • Tarih: 21 Şubat 2024
  • Bağlantılar:Arxiv Makalesi, GitHub Deposu

Mimari ve Metodolojiler

YOLOv9, Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) ile birlikte Programlanabilir Gradyan Bilgisi (PGI) kavramını tanıtır. PGI, ana ağın çıkarım ek yükü olmadan sağlam, güvenilir özellikler öğrenmesini sağlayan yardımcı denetim sağlayarak bilgi darboğazını giderir. Bu arada, GELAN parametre kullanımını optimize ederek modelin hesaplama maliyetini yönetilebilir tutarken son teknoloji ortalama Hassasiyet (mAP) elde etmesini sağlar. Bu, tıbbi görüntü analizi veya özellik doğruluğunun kritik olduğu son derece küçük nesneleri detect etmek için onu olağanüstü bir seçim haline getirir.

YOLOv9 hakkında daha fazla bilgi edinin.

YOLOv6-3.0 Genel Bakış: Endüstriyel Ölçek İçin Tasarlandı

Meituan tarafından geliştirilen YOLOv6-3.0 (aynı zamanda v3.0 olarak da anılır), ağır hizmet endüstriyel uygulamalara hizmet etmek üzere sıfırdan tasarlanmıştır. 2023'ün başlarında piyasaya sürülen bu model, kenar donanımlarda üstün performans gösteren bir dizi niceleme dostu model sunarak dağıtım verimliliğine büyük ölçüde odaklanmaktadır.

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
  • Kuruluş: Meituan
  • Tarih: 13 Ocak 2023
  • Bağlantılar:Arxiv Makalesi, GitHub Deposu

Mimari ve Metodolojiler

YOLOv6-3.0, RepOptimizer ve Çapa Destekli Eğitim (AAT) stratejileriyle kendini gösterir. Model, RepVGG'den esinlenilmiş donanım farkındalıklı bir sinir ağı tasarımı kullanır ve bu sayede katmanları birleştirerek çıkarım sırasında GPU'larda olağanüstü hızlı çalışmasını sağlar. 3.0 güncellemesi, yerelleştirme doğruluğunu artırmak için Çift Yönlü Birleştirme (BiC) modülü ekleyerek mimariyi daha da geliştirdi. TensorRT ve OpenVINO gibi dağıtım formatları için yüksek düzeyde optimize edildiğinden, YOLOv6-3.0 lojistik, üretim otomasyonu ve yüksek verimli sunucu ortamlarında sıkça benimsenmektedir.

YOLOv6-3.0 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Bu modelleri standart COCO veri kümesi üzerinde değerlendirirken, doğruluk ve ham çıkarım hızı arasında belirgin ödünleşimler gözlemleyebiliriz.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Teknik Analiz

YOLOv6-3.0n, T4 donanımında ham hızda (1.17ms) zirveye otururken, YOLOv9t parametrelerin yarısından daha azını (2.0M'ye karşı 4.7M) ve önemli ölçüde daha az FLOPs kullanarak biraz daha yüksek bir mAP (%38.3) elde etmeyi başarır. Karmaşık, yüksek doğruluk gereksinimleri için, devasa YOLOv9e doğruluğu %55.6 mAP'ye çıkararak PGI mimarisinin derin ağlardaki gücünü göstermektedir.

Projenizi YOLO26 ile Geleceğe Hazırlayın

Yeni bir bilgisayar görüşü girişimi başlatıyorsanız, YOLO26’yı kullanmanızı şiddetle tavsiye ederiz. 2026'da piyasaya sürülen bu model, işlem sonrası gecikmeyi tamamen ortadan kaldıran ve %43'e kadar Daha Hızlı CPU Çıkarımı sağlayan yerel bir Uçtan Uca NMS-Serbest Tasarım özelliğine sahiptir.

Ultralytics Ekosisteminin Avantajı

Hangi modelin mimari felsefesi size hitap ederse etsin, bunları Ultralytics Python API aracılığıyla yerel olarak uygulamak, üstün bir geliştirici deneyimi sunar.

Kullanım Kolaylığı ve Eğitim Verimliliği

Karmaşık derin öğrenme modellerini eğitmek geleneksel olarak büyük miktarda şablon kod gerektirir. Ultralytics Platformu bu karmaşıklıkları soyutlar. İster hata tespiti için YOLOv9'u ince ayar yapıyor olun, ister mobil uygulamalar için YOLOv6'yı dışa aktarıyor olun, iş akışı dikkat çekici derecede tutarlı kalır.

Ayrıca, Ultralytics mimarileri genellikle eğitim sırasında hantal transformatör tabanlı modellere kıyasla daha düşük CUDA bellek gereksinimleri sunar. Bu, geliştiricilerin tüketici sınıfı GPU'larda daha büyük yığın boyutları kullanmasına olanak tanır ve eğitim verimliliğini büyük ölçüde artırır.

from ultralytics import YOLO

# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")

# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Export to ONNX or TensorRT seamlessly
model.export(format="engine", half=True)

Görsel Görevlerde Benzersiz Çok Yönlülük

YOLOv6-3.0 hızlı sınırlayıcı kutu üretimi için yoğun bir şekilde optimize edilmiş olsa da, modern bilgisayar görüşü projeleri genellikle çok görevli bir yaklaşım gerektirir. Ultralytics modelleri, aşırı çok yönlülükleriyle öne çıkar. Ultralytics YOLOv8 ve daha yeni YOLO26 gibi araçlarla, tek bir çerçeve nesne tespiti, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) sorunsuz bir şekilde ele alır.

YOLO26 ile Tanışın: Yeni Standart

Hem performansı hem de dağıtım kolaylığını en üst düzeye çıkarmak isteyen kuruluşlar için YOLO26, hız ve doğruluğun nihai birleşimini temsil eder.

YOLO11’in başarıları üzerine inşa edilen YOLO26, birkaç paradigma değiştiren özellik sunar:

  • MuSGD Optimizatörü: Moonshot AI'nin Kimi K2'si gibi Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenen bu hibrit optimizatör, inanılmaz derecede kararlı eğitim ve hızlı yakınsama sağlar.
  • DFL Kaldırma: Distribution Focal Loss'u çıkararak, YOLO26 dışa aktarma grafiğini basitleştirir ve düşük güçlü uç bilişim çipleriyle önemli ölçüde daha uyumlu hale getirir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone operasyonları ve IoT uygulamaları için kritik öneme sahip olan küçük nesne tanımada dikkate değer iyileştirmeler sağlar.
  • Göreve Özel İyileştirmeler: YOLO26, segmentasyon için yerel çok ölçekli prototipleme, iskelet takibi için Artık Log-Olasılık Tahmini (RLE) ve OBB tespiti'ndeki uç durumları çözmek için özel açı kaybı algoritmaları içerir.

İdeal Dağıtım Senaryoları

Doğru mimariyi seçmek nihayetinde üretim kısıtlamalarınıza bağlıdır.

Endüstriyel üretimde yerleşik bir iş akışınız varsa, nicelemeye büyük ölçüde güveniyorsanız ve mutlak en düşük milisaniye altı donanım gecikmesine ihtiyacınız olan yerlerde özel çıkarım hızlandırıcıları kullanıyorsanız YOLOv6-3.0’ı seçin.

Karmaşık sağlık teşhisleri veya ince, piksel düzeyindeki özelliklerin gözden kaçırılmasının bir seçenek olmadığı uzun menzilli gözetim ile uğraşıyorsanız YOLOv9’u seçin.

Ancak, basitleştirilmiş, NMS-serbest dağıtımın yanı sıra en son doğruluğu sunan mükemmel dengeli bir yaklaşım için, Ultralytics YOLO26 modern bilgisayar görüşü mühendisliği için kesin bir öneri olarak öne çıkmaktadır. Aktif geliştirme döngüsü, kapsamlı dokümantasyonu ve canlı topluluk desteği, onu hem araştırmacılar hem de geliştiriciler için vazgeçilmez bir araç haline getirmektedir.


Yorumlar