Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 ve YOLOv9 Karşılaştırması#

Gerçek zamanlı nesne tespiti alanı, daha yüksek doğruluk, daha düşük gecikme süresi ve daha iyi donanım kullanımı talepleriyle gelişmeye devam ediyor. Bu kapsamlı karşılaştırma, alandaki iki önemli dönüm noktasını incelemektedir: Endüstriyel verimlilik için geliştirilen YOLOv6-3.0 ve derin öğrenme bilgi darboğazlarını aşmak için yeni mimariler sunan YOLOv9.

Her iki model de benzersiz mimari yenilikler sunsa da, performans ve dağıtım kolaylığının nihai dengesini arayan geliştiriciler genellikle modern ekosistemlere geçiş yapmaktadır. Yeni projelere başlayanlar için, yerel olarak uçtan uca çalışan Ultralytics YOLO26 önerilen standarttır ve önemli ölçüde daha akıcı bir geliştirici deneyimi ile en gelişmiş doğruluk oranını sunar.

Link to this sectionYOLOv6-3.0: Endüstriyel Verimlilik Optimizasyonu#

Meituan'daki Vision AI Departmanı tarafından geliştirilen YOLOv6-3.0, özellikle GPU donanımında endüstriyel uygulamalarda maksimum verimlilik için kapsamlı bir şekilde tasarlanmıştır.

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
  • Organizasyon: Meituan
  • Tarih: 13 Ocak 2023
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this sectionMimari Yenilikler#

YOLOv6-3.0, özellik birleştirme ve donanım verimliliğini artırmak için çeşitli temel değişiklikler getirmiştir. Mimari, boyun kısmında daha doğru yerelleştirme sinyalleri sağlayan bir Çift Yönlü Birleştirme (Bi-directional Concatenation - BiC) modülü içermektedir. Ayrıca bir Çapa Destekli Eğitim (Anchor-Aided Training - AAT) stratejisi kullanır. Bu yaklaşım, çapa tabanlı eğitimin zengin rehberliğini, çapasız paradigmanın çıkarım hızıyla birleştirerek, dağıtımı yavaşlatmadan daha iyi performans sağlar.

Omurga yapısı, GPU çıkarımı için donanım dostu olacak şekilde titizlikle optimize edilmiş EfficientRep tasarımına dayanmaktadır. Bu, onu ağır toplu işlem süreçlerinin standart olduğu endüstriyel üretim senaryoları için oldukça yetenekli kılar.

Link to this sectionGüçlü ve Zayıf Yönler#

YOLOv6-3.0'ın temel gücü, NVIDIA T4 gibi GPU'larda yüksek kare hızında yatmaktadır ve bu da onu yüksek yoğunluklu video anlama akışları için uygun hale getirir. Ancak, belirli donanım optimizasyonlarına olan ağır bağımlılığı, yalnızca CPU kullanan uç cihazlarda ideal olmayan gecikme sürelerine neden olabilir. Ayrıca, eğitim hattını kurmak, daha birleşik çerçevelere kıyasla karmaşık olabilir.

YOLOv6 hakkında daha fazla bilgi edin

Link to this sectionYOLOv9: Programlanabilir Gradyan Bilgisi#

Bir yıl sonra piyasaya sürülen YOLOv9, derin sinir ağlarında doğal olarak bulunan bilgi darboğazı problemini çözmeye odaklanarak CNN mimarilerinin teorik sınırlarını zorlamaktadır.

Link to this sectionMimari Yenilikler#

YOLOv9'un en büyük katkısı, kritik verilerin birden fazla ağ katmanından geçerken korunmasını sağlayan ve daha güvenilir ağırlık güncellemelerine olanak tanıyan Programlanabilir Gradyan Bilgisi (PGI)'dır. PGI'nın yanı sıra model, Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) özelliğine sahiptir. GELAN, parametre verimliliğini maksimize ederek YOLOv9'un birçok selefinden daha az hesaplama FLOP'u ile üstün doğruluk elde etmesini sağlar.

Link to this sectionGüçlü ve Zayıf Yönler#

YOLOv9, COCO gibi kıyaslama veri kümelerinde olağanüstü ortalama Hassasiyet (mAP) değerlerine ulaşır ve bu da onu ham doğruluğa öncelik veren araştırmacılar için favori kılar. Ancak YOLOv6 gibi, son işleme (post-processing) için geleneksel Maksimum Olmayan Baskılama (NMS) yöntemine dayanır. Bu, özellikle ONNX veya TensorRT gibi formatlar kullanılarak uç cihazlara aktarılırken gecikmeyi artırır ve model dağıtımı hattını karmaşıklaştırır.

YOLOv9 hakkında daha fazla bilgi edin

Link to this sectionPerformans Karşılaştırması#

Bu modelleri karşılaştırırken doğruluk, parametre sayısı ve çıkarım hızı arasındaki dengeye bakmak çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#

YOLOv6-3.0 ve YOLOv9 sağlam mimariler sunsa da, üretim ortamları bakımı iyi yapılmış bir ekosistem, düşük bellek gereksinimleri ve olağanüstü kullanım kolaylığı talep eder. İşte Ultralytics Platform ile YOLO11 ve en güncel YOLO26 gibi modellerin öne çıktığı nokta budur.

2026'nın başlarında piyasaya sürülen YOLO26, eski darboğazları ortadan kaldırarak dağıtım verimliliğini temelden yeniden tanımlamaktadır.

Yerel Uçtan Uca Tasarım

YOLO26, Maksimum Olmayan Baskılama (NMS) sonrası işleme ihtiyacını tamamen ortadan kaldıran Uçtan Uca NMS'siz Tasarım özelliğine sahiptir. Bu, çıkarım gecikmesi değişkenliğini önemli ölçüde azaltır ve uç dağıtım mantığını basitleştirir.

Link to this sectionTemel YOLO26 Yenilikleri#

  1. MuSGD Optimize Edici: LLM eğitiminden (Moonshot AI'ın Kimi K2'si gibi) esinlenen YOLO26, SGD ve Muon'un bir hibritini kullanır. Bu, bilgisayarlı görü görevlerine benzersiz bir eğitim kararlılığı ve daha hızlı yakınsama getirir.
  2. %43'e Kadar Daha Hızlı CPU Çıkarımı: YOLOv6'nın ağır GPU odağının aksine, YOLO26 uç cihazlar için yoğun şekilde optimize edilmiştir. Distribution Focal Loss (DFL) özelliğinin kaldırılması, baş kısmını basitleştirerek düşük güçlü CPU'lar ve uç bilişim donanımıyla yüksek düzeyde uyumlu hale getirir.
  3. ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, hava görüntüleri ve robotik için kritik öneme sahip olan küçük nesne tespitini önemli ölçüde iyileştirir.
  4. Benzersiz Çok Yönlülük: YOLOv6 sadece bir tespit motoruyken, YOLO26 örnek segmentasyonu, sınıflandırma, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) tespitini sorunsuz bir şekilde gerçekleştirir.

YOLO26 hakkında daha fazla bilgi edin

Link to this sectionUltralytics ile Sorunsuz Eğitim#

En gelişmiş modelleri eğitmek karmaşık bash scriptleri gerektirmemelidir. Ultralytics Python API, otomatik veri yükleme, minimum CUDA bellek kullanımı ve yerleşik takip özelliği ile akıcı bir deneyim sunar.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX with a single command
model.export(format="onnx")

Link to this sectionİdeal Kullanım Senaryoları#

Doğru mimariyi seçmek tamamen hedef dağıtım ortamına bağlıdır:

  • YOLOv6-3.0'ı şu durumlarda kullan: Sunucu sınıfı GPU'ların (örneğin A100'ler) bol olduğu ve toplu işleme verimi maksimize ettiği fabrika otomasyonu ve kusur tespiti gibi senaryolarda.
  • YOLOv9'u şu durumlarda kullan: COCO gibi standart veri kümelerinde mutlak en yüksek mAP değerini almanın birincil hedef olduğu akademik araştırmalar veya yarışmalarda.
  • YOLO26'yı şu durumlarda kullan: Hemen hemen tüm modern ticari uygulamalarda. NMS'siz mimarisi, düşük bellek kullanımı ve yüksek hızlı CPU çıkarımı, onu güvenlik alarm sistemleri, akıllı perakende ve gömülü cihazlarda gerçek zamanlı nesne takibi için mükemmel kılar.

Kapsamlı Ultralytics ekosisteminden yararlanarak geliştiriciler, özel gerçek dünya zorlukları için mükemmel performans dengesini bulmak adına YOLOv8, YOLO11 ve YOLO26 ile kolayca denemeler yapabilirler.

Katkıda Bulunanlar

Yorumlar