YOLO26 ve YOLOX: Gerçek Zamanlı Nesne Algılamayı Geliştirmek
Bilgisayar görüşünün hızla gelişen dünyasında, uygulamanız için doğru modeli seçmek kritik öneme sahiptir. Bu kılavuz, kenar ve gerçek zamanlı uygulamalar için en son teknoloji modeli olan Ultralytics YOLO26 ile Megvii tarafından 2021'de piyasaya sürülen yüksek performanslı anchor-free dedektör YOLOX arasında derinlemesine bir teknik karşılaştırma sunmaktadır. Projeleriniz için bilinçli kararlar vermenize yardımcı olmak amacıyla mimarilerini, performans metriklerini ve dağıtım uygunluklarını analiz ediyoruz.
Modellere Genel Bakış
Teknik detaylara dalmadan önce, her modelin gelişimini yönlendiren kökenleri ve temel felsefeleri anlamak önemlidir.
Ultralytics YOLO26
Glenn Jocher ve Jing Qiu tarafından Ocak 2026'da Ultralytics'te piyasaya sürülen YOLO26, verimlilik ve kullanılabilirlik açısından önemli bir ilerlemeyi temsil etmektedir. Kenar ve düşük güçlü cihazlar için özel olarak tasarlanmış olup, yerel uçtan uca NMS-free bir mimari sunar. Bu tasarım, dağıtım hatlarında yaygın bir darboğaz olan Non-Maximum Suppression (NMS) son işleme ihtiyacını ortadan kaldırır.
Temel yenilikler arasında Moonshot AI'ın Kimi K2'sinden ilham alan ve Büyük Dil Modeli (LLM) eğitim tekniklerini görüş görevlerine uyarlayan MuSGD optimize edici ve dışa aktarma süreçlerini kolaylaştırmak için Distribution Focal Loss (DFL) kaldırılması bulunmaktadır. Önceki modellere kıyasla %43'e kadar daha hızlı CPU çıkarımı ile YOLO26, GPU hızlandırması olmadan yüksek hız gerektiren senaryolarda üstün performans gösterir.
YOLO26 hakkında daha fazla bilgi edinin
YOLOX
Megvii'deki araştırmacılar tarafından 2021'de geliştirilen YOLOX, YOLO ailesi içinde anchor-free detect paradigmasını popülerleştiren önemli bir sürümdü. Tahmin başlığını ayırarak ve etiket ataması için SimOTA'yı kullanarak, YOLOX rekabetçi doğruluk elde etti ve CVPR 2021 Çalıştayı'nda Streaming Perception Challenge'ı kazandı. Temiz tasarımı ve yüksek performanslı GPU ortamlarındaki etkinliği nedeniyle araştırma camiasında saygın bir model olmaya devam etmektedir.
YOLOX hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Nesne dedektörlerini değerlendirirken, hız (gecikme) ve doğruluk (mAP) arasındaki denge çok önemlidir. YOLO26, özellikle CPU tabanlı donanımlarda her iki metrikte de önemli avantajlar göstermektedir.
Metrik Analizi
Aşağıdaki tablo, COCO veri kümesi üzerindeki çeşitli model ölçeklerinin performansını vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Performans Yorumlaması
YOLO26, doğruluk (mAP) açısından tüm ölçeklerde YOLOX'u sürekli olarak geride bırakmaktadır. Örneğin, YOLO26s 48.6 mAP elde ederken, YOLOX-s 40.5 mAP'ye sahiptir; bu, benzer boyuttaki modeller için önemli bir gelişmedir. Ek olarak, YOLO26'nın yerel uçtan uca tasarımı, listelenen hızların toplam çıkarım süresini yansıttığını garanti ederken, geleneksel karşılaştırmalar genellikle NMS süresini hariç tutar.
Mimari Temel Farklılıklar
1. Uçtan Uca ve Son İşleme
En belirleyici farklardan biri çıkarım hattıdır.
- YOLO26: Yerel olarak uçtan uca. Gelişmiş eğitim teknikleri kullanarak, Non-Maximum Suppression (NMS) gerektirmeden nesnelerin tam sayısını tahmin eder. Bu, dağıtım için bir atılımdır, çünkü NMS genellikle NPU'lar ve kenar işlemciler üzerinde hızlandırılması zordur.
- YOLOX: NMS'ye dayanır. Başlığı basitleştirmek için anchor-free bir mekanizma sunsa da, ham çıktı hala filtrelenmesi gereken çakışan kutular içerir, bu da TensorRT veya CoreML gibi formatlara model dışa aktarımı sırasında gecikme ve karmaşıklık ekler.
2. Kayıp Fonksiyonları ve Optimizasyon
YOLO26, ProgLoss (Aşamalı Kayıp Dengeleme) ve STAL (Küçük Hedefe Duyarlı Etiket Ataması) özelliklerini sunar. Bu yenilikler, önceki dedektörlerde yaygın bir zayıflık olan küçük nesne algılamayı özel olarak hedefler. Ayrıca, YOLO26, SGD ve Muon'un bir melezi olan MuSGD optimize ediciyi kullanır ve bu, YOLOX'ta kullanılan standart optimize edicilerden önemli ölçüde daha hızlı eğitim stabilize eder.
3. Kenar Optimizasyonu
YOLO26, Distribution Focal Loss (DFL) modülünü açıkça kaldırır. DFL (YOLOv8 gibi modellerde kullanılır) kutu hassasiyetini artırsa da, belirli donanımlarda yavaş olabilen işlemlere dayanır. Bunu kaldırarak, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder ve bu da onu Raspberry Pi, mobil CPU'lar ve diğer kaynak kısıtlı ortamlar için üstün bir seçenek haline getirir.
Kullanım Kolaylığı ve Ekosistem
Geliştiriciler için bir modelin "yumuşak" özellikleri (belgeleme, API kalitesi ve destek) ham metrikler kadar önemlidir.
Ultralytics'in Avantajı
YOLO26, sağlam Ultralytics ekosistemine entegre edilmiştir. Bu şunları sağlar:
- Basit python API'si: Üç satır kodla yükleyin, eğitin ve dağıtın.
- Çok Yönlülük: Öncelikli olarak bir detectör olan YOLOX'un aksine, YOLO26 kutudan çıktığı haliyle Örnek Segmentasyon, Poz Tahmini, Yönlendirilmiş Sınırlayıcı Kutular (OBB) ve Sınıflandırmayı destekler.
- Bakım: Sık güncellemeler, kapsamlı belgeleme ve GitHub ile Discord üzerinden aktif topluluk desteği.
YOLOX Ekosistemi
YOLOX, sağlam bir PyTorch uygulaması sunar ve ONNX ile TensorRT gibi formatları destekler. Ancak, genellikle eğitim ve çıkarım için daha fazla şablon kod gerektirir. ultralytics paketi. Ekosistemi daha az merkezileştirilmiştir ve genellikle kullanıcıların Ultralytics modelleriyle standart olarak gelen veri artırmalarını ve dağıtım betiklerini manuel olarak yönetmesini gerektirir.
Kod Karşılaştırması
Kullanılabilirlik farkı en iyi kod aracılığıyla gösterilir.
YOLO26'yı Ultralytics ile Eğitme:
from ultralytics import YOLO
# Load model and train on COCO8 dataset
model = YOLO("yolo26n.pt")
model.train(data="coco8.yaml", epochs=100, imgsz=640)
YOLOX Eğitimi (Standart Uygulama):Depoyu klonlamayı, belirli gereksinimleri yüklemeyi, veri setini belirli bir dizin yapısında hazırlamayı ve karmaşık CLI dizeleri çalıştırmayı gerektirir.
# Example YOLOX training command (conceptual)
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o -c yolox_s.pth
İdeal Kullanım Senaryoları
YOLO26 Ne Zaman Seçilmeli
- Uç Dağıtım: Eğer TensorRT veya NPU hızlandırmasının sınırlı olduğu mobil cihazlara, IoT sensörlerine veya CPU'lara dağıtım yapıyorsanız.
- Karmaşık Görevler: Projeniz standart detect işleminin yanı sıra segmentasyon, poz tahmini veya dönen nesneleri (OBB) detect etmeyi gerektirdiğinde.
- Hızlı Geliştirme: Veri seti yönetimi için yerleşik desteğe sahip, kararlı, iyi belgelenmiş bir API kullanarak hızlı bir şekilde yineleme yapmanız gerektiğinde.
- Küçük Nesne Algılama: Küçük hedefleri tahmin etmenin kritik olduğu hava görüntüleme veya kalite kontrol gibi uygulamalar.
Ne Zaman YOLOX Düşünülmeli
- Eski Araştırmalar: Eğer 2021-2022 yıllarına ait, orijinal YOLOX makalesine karşı özel olarak kıyaslanan akademik sonuçları yeniden üretiyorsanız.
- Özel Özelleştirme: Eğer belirli YOLOX mimarisi etrafında yoğun bir şekilde özelleştirilmiş mevcut bir hattınız varsa ve geçiş maliyeti çok yüksekse.
Sonuç
YOLOX, anchor-free nesne algılama tarihinde önemli bir kilometre taşı olmaya devam etse de, YOLO26, modern yapay zeka uygulamaları için daha kapsamlı bir çözüm sunar. Yerel uçtan uca mimarisi, üstün doğruluk-hız oranı ve Ultralytics ekosisteminin desteğiyle YOLO26, hem yeni projeler hem de mevcut dağıtımları yükseltmek için önerilen bir seçimdir.
MuSGD eğitim kararlılığı, DFL-free verimlilik ve görev çok yönlülüğünün birleşimi, YOLO26'nın nesneleri daha hızlı detect etmesinin yanı sıra, eğitimden dağıtıma kadar tüm makine öğrenimi yaşam döngüsünü basitleştirmesini sağlar.
Daha Fazla Okuma
YOLO ailesindeki diğer modelleri keşfetmek isteyenler için şunları gözden geçirebilirsiniz:
- YOLO11: YOLO26'nın öncülü, mükemmel performans ve geniş uyumluluk sunar.
- YOLOv10: NMS-free eğitimi tanıtan ilk yineleme olup, YOLO26'nın ilerlemelerinin önünü açmıştır.
- YOLO World: Eğitim setinde bulunmayan nesneleri detect etmeniz gereken açık kelime dağarcığı detect görevleri için.