İçeriğe geç

YOLO26 ve YOLOX: Gerçek Zamanlı Nesne Algılamayı Geliştirmek

Bilgisayar görüşünün hızla gelişen dünyasında, uygulamanız için doğru modeli seçmek kritik öneme sahiptir. Bu kılavuz, kenar ve gerçek zamanlı uygulamalar için en son teknoloji modeli olan Ultralytics YOLO26 ile Megvii tarafından 2021'de piyasaya sürülen yüksek performanslı anchor-free dedektör YOLOX arasında derinlemesine bir teknik karşılaştırma sunmaktadır. Projeleriniz için bilinçli kararlar vermenize yardımcı olmak amacıyla mimarilerini, performans metriklerini ve dağıtım uygunluklarını analiz ediyoruz.

Modellere Genel Bakış

Teknik detaylara dalmadan önce, her modelin gelişimini yönlendiren kökenleri ve temel felsefeleri anlamak önemlidir.

Ultralytics YOLO26

Glenn Jocher ve Jing Qiu tarafından Ocak 2026'da Ultralytics'te piyasaya sürülen YOLO26, verimlilik ve kullanılabilirlik açısından önemli bir ilerlemeyi temsil etmektedir. Kenar ve düşük güçlü cihazlar için özel olarak tasarlanmış olup, yerel uçtan uca NMS-free bir mimari sunar. Bu tasarım, dağıtım hatlarında yaygın bir darboğaz olan Non-Maximum Suppression (NMS) son işleme ihtiyacını ortadan kaldırır.

Temel yenilikler arasında Moonshot AI'ın Kimi K2'sinden ilham alan ve Büyük Dil Modeli (LLM) eğitim tekniklerini görüş görevlerine uyarlayan MuSGD optimize edici ve dışa aktarma süreçlerini kolaylaştırmak için Distribution Focal Loss (DFL) kaldırılması bulunmaktadır. Önceki modellere kıyasla %43'e kadar daha hızlı CPU çıkarımı ile YOLO26, GPU hızlandırması olmadan yüksek hız gerektiren senaryolarda üstün performans gösterir.

YOLO26 hakkında daha fazla bilgi edinin

YOLOX

Megvii'deki araştırmacılar tarafından 2021'de geliştirilen YOLOX, YOLO ailesi içinde anchor-free detect paradigmasını popülerleştiren önemli bir sürümdü. Tahmin başlığını ayırarak ve etiket ataması için SimOTA'yı kullanarak, YOLOX rekabetçi doğruluk elde etti ve CVPR 2021 Çalıştayı'nda Streaming Perception Challenge'ı kazandı. Temiz tasarımı ve yüksek performanslı GPU ortamlarındaki etkinliği nedeniyle araştırma camiasında saygın bir model olmaya devam etmektedir.

YOLOX hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Nesne dedektörlerini değerlendirirken, hız (gecikme) ve doğruluk (mAP) arasındaki denge çok önemlidir. YOLO26, özellikle CPU tabanlı donanımlarda her iki metrikte de önemli avantajlar göstermektedir.

Metrik Analizi

Aşağıdaki tablo, COCO veri kümesi üzerindeki çeşitli model ölçeklerinin performansını vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Performans Yorumlaması

YOLO26, doğruluk (mAP) açısından tüm ölçeklerde YOLOX'u sürekli olarak geride bırakmaktadır. Örneğin, YOLO26s 48.6 mAP elde ederken, YOLOX-s 40.5 mAP'ye sahiptir; bu, benzer boyuttaki modeller için önemli bir gelişmedir. Ek olarak, YOLO26'nın yerel uçtan uca tasarımı, listelenen hızların toplam çıkarım süresini yansıttığını garanti ederken, geleneksel karşılaştırmalar genellikle NMS süresini hariç tutar.

Mimari Temel Farklılıklar

1. Uçtan Uca ve Son İşleme

En belirleyici farklardan biri çıkarım hattıdır.

  • YOLO26: Yerel olarak uçtan uca. Gelişmiş eğitim teknikleri kullanarak, Non-Maximum Suppression (NMS) gerektirmeden nesnelerin tam sayısını tahmin eder. Bu, dağıtım için bir atılımdır, çünkü NMS genellikle NPU'lar ve kenar işlemciler üzerinde hızlandırılması zordur.
  • YOLOX: NMS'ye dayanır. Başlığı basitleştirmek için anchor-free bir mekanizma sunsa da, ham çıktı hala filtrelenmesi gereken çakışan kutular içerir, bu da TensorRT veya CoreML gibi formatlara model dışa aktarımı sırasında gecikme ve karmaşıklık ekler.

2. Kayıp Fonksiyonları ve Optimizasyon

YOLO26, ProgLoss (Aşamalı Kayıp Dengeleme) ve STAL (Küçük Hedefe Duyarlı Etiket Ataması) özelliklerini sunar. Bu yenilikler, önceki dedektörlerde yaygın bir zayıflık olan küçük nesne algılamayı özel olarak hedefler. Ayrıca, YOLO26, SGD ve Muon'un bir melezi olan MuSGD optimize ediciyi kullanır ve bu, YOLOX'ta kullanılan standart optimize edicilerden önemli ölçüde daha hızlı eğitim stabilize eder.

3. Kenar Optimizasyonu

YOLO26, Distribution Focal Loss (DFL) modülünü açıkça kaldırır. DFL (YOLOv8 gibi modellerde kullanılır) kutu hassasiyetini artırsa da, belirli donanımlarda yavaş olabilen işlemlere dayanır. Bunu kaldırarak, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder ve bu da onu Raspberry Pi, mobil CPU'lar ve diğer kaynak kısıtlı ortamlar için üstün bir seçenek haline getirir.

Kullanım Kolaylığı ve Ekosistem

Geliştiriciler için bir modelin "yumuşak" özellikleri (belgeleme, API kalitesi ve destek) ham metrikler kadar önemlidir.

Ultralytics'in Avantajı

YOLO26, sağlam Ultralytics ekosistemine entegre edilmiştir. Bu şunları sağlar:

YOLOX Ekosistemi

YOLOX, sağlam bir PyTorch uygulaması sunar ve ONNX ile TensorRT gibi formatları destekler. Ancak, genellikle eğitim ve çıkarım için daha fazla şablon kod gerektirir. ultralytics paketi. Ekosistemi daha az merkezileştirilmiştir ve genellikle kullanıcıların Ultralytics modelleriyle standart olarak gelen veri artırmalarını ve dağıtım betiklerini manuel olarak yönetmesini gerektirir.

Kod Karşılaştırması

Kullanılabilirlik farkı en iyi kod aracılığıyla gösterilir.

YOLO26'yı Ultralytics ile Eğitme:

from ultralytics import YOLO

# Load model and train on COCO8 dataset
model = YOLO("yolo26n.pt")
model.train(data="coco8.yaml", epochs=100, imgsz=640)

YOLOX Eğitimi (Standart Uygulama):Depoyu klonlamayı, belirli gereksinimleri yüklemeyi, veri setini belirli bir dizin yapısında hazırlamayı ve karmaşık CLI dizeleri çalıştırmayı gerektirir.

# Example YOLOX training command (conceptual)
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o -c yolox_s.pth

İdeal Kullanım Senaryoları

YOLO26 Ne Zaman Seçilmeli

  • Uç Dağıtım: Eğer TensorRT veya NPU hızlandırmasının sınırlı olduğu mobil cihazlara, IoT sensörlerine veya CPU'lara dağıtım yapıyorsanız.
  • Karmaşık Görevler: Projeniz standart detect işleminin yanı sıra segmentasyon, poz tahmini veya dönen nesneleri (OBB) detect etmeyi gerektirdiğinde.
  • Hızlı Geliştirme: Veri seti yönetimi için yerleşik desteğe sahip, kararlı, iyi belgelenmiş bir API kullanarak hızlı bir şekilde yineleme yapmanız gerektiğinde.
  • Küçük Nesne Algılama: Küçük hedefleri tahmin etmenin kritik olduğu hava görüntüleme veya kalite kontrol gibi uygulamalar.

Ne Zaman YOLOX Düşünülmeli

  • Eski Araştırmalar: Eğer 2021-2022 yıllarına ait, orijinal YOLOX makalesine karşı özel olarak kıyaslanan akademik sonuçları yeniden üretiyorsanız.
  • Özel Özelleştirme: Eğer belirli YOLOX mimarisi etrafında yoğun bir şekilde özelleştirilmiş mevcut bir hattınız varsa ve geçiş maliyeti çok yüksekse.

Sonuç

YOLOX, anchor-free nesne algılama tarihinde önemli bir kilometre taşı olmaya devam etse de, YOLO26, modern yapay zeka uygulamaları için daha kapsamlı bir çözüm sunar. Yerel uçtan uca mimarisi, üstün doğruluk-hız oranı ve Ultralytics ekosisteminin desteğiyle YOLO26, hem yeni projeler hem de mevcut dağıtımları yükseltmek için önerilen bir seçimdir.

MuSGD eğitim kararlılığı, DFL-free verimlilik ve görev çok yönlülüğünün birleşimi, YOLO26'nın nesneleri daha hızlı detect etmesinin yanı sıra, eğitimden dağıtıma kadar tüm makine öğrenimi yaşam döngüsünü basitleştirmesini sağlar.

Daha Fazla Okuma

YOLO ailesindeki diğer modelleri keşfetmek isteyenler için şunları gözden geçirebilirsiniz:

  • YOLO11: YOLO26'nın öncülü, mükemmel performans ve geniş uyumluluk sunar.
  • YOLOv10: NMS-free eğitimi tanıtan ilk yineleme olup, YOLO26'nın ilerlemelerinin önünü açmıştır.
  • YOLO World: Eğitim setinde bulunmayan nesneleri detect etmeniz gereken açık kelime dağarcığı detect görevleri için.

Yorumlar