İçeriğe geç

YOLO26 ve YOLOX: Çıpasız Nesne Algılamada Yeni Bir Dönem

Bilgisayar görüşünün evrimi, önemli mimari sıçramalarla damgasını vurmuştur. 2021'de YOLOX, akademik araştırma ile endüstriyel uygulama arasındaki boşluğu dolduran oldukça etkili bir çıpasız paradigma tanıttı. 2026'ya gelindiğinde ise, manzara Ultralytics YOLO tarafından, özellikle de YOLO26'nın piyasaya sürülmesiyle yeniden tanımlanmıştır. Bu kapsamlı karşılaştırma, YOLO26'nın eşsiz performans, çok yönlülük ve kullanım kolaylığı sunmak için tarihsel yenilikler üzerine nasıl inşa edildiğini incelemektedir.

Model Genel Bakışları

Bu modellerin kökenlerini ve temel felsefelerini anlamak, bilinçli dağıtım kararları vermek için çok önemlidir.

YOLO26 Detayları

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, modern yapay zeka mühendisliğinin zirvesini temsil eder; karmaşık son işleme darboğazlarını ortadan kaldıran yerel uçtan uca bir tasarım sunar. Hem bulut hem de uç dağıtımlar için yoğun bir şekilde optimize edilmiş olup, çeşitli görevleri sorunsuz bir şekilde destekleyen bir ekosisteme sahiptir.

YOLOX Detayları

YOLOX hakkında daha fazla bilgi edinin

YOLOX ileriye doğru atılmış büyük bir adımdı; ayrık bir başlık ve SimOTA etiket atama stratejisinin yanı sıra çıpasız bir mimari sunuyordu. Piyasaya sürüldüğü zaman hız ve doğruluk arasında mükemmel bir denge sunarak, birçok eski sistem için popüler bir seçenek haline gelmişti.

Mimari Yenilikler

YOLO26 ve YOLOX arasındaki farklar, derin öğrenme tasarımındaki beş yıllık aralıksız yeniliği vurgulamaktadır.

YOLOX çıpasız yaklaşımı savunurken, gereksiz sınırlayıcı kutuları filtrelemek için geleneksel Non-Maximum Suppression (NMS) yöntemine büyük ölçüde güveniyordu. YOLO26, Uçtan Uca NMS'siz Bir Tasarım sunar. YOLOv10'da ilk kez öncülük edilen bu çığır açan gelişme, NMS son işleme adımını tamamen ortadan kaldırarak, önemli ölçüde daha düşük gecikme varyansı ile daha hızlı ve daha basit dağıtım hatları sağlar.

Ayrıca, YOLO26 DFL Kaldırma özelliğine sahiptir. Distribution Focal Loss'un kaldırılmasıyla, modelin dışa aktarma süreci önemli ölçüde basitleşir ve uç cihazlar ile düşük güçlü donanımlarla olağanüstü uyumluluk sağlar. Modelin mimari optimizasyonlarıyla birleştiğinde, YOLO26 seleflerine kıyasla %43'e kadar daha hızlı CPU çıkarımı elde ederek, özel GPU'ları olmayan ortamlar için güçlü bir çözüm haline gelir.

Eğitim kararlılığı bir diğer kritik farklılaştırıcıdır. YOLO26, Moonshot AI'dan gelen LLM eğitim yeniliklerinden esinlenerek SGD ve Muon'un bir hibriti olan yeni MuSGD Optimizatörünü kullanır. Bu optimizatör, büyük dil modeli eğitim kararlılığını bilgisayar görüşüne getirerek daha hızlı yakınsamayı kolaylaştırır.

Gelişmiş Kayıp Fonksiyonları

YOLO26, küçük nesne tanımada önemli iyileşmeler sağlayan özel kayıp fonksiyonları olan ProgLoss + STAL kullanır. Bu, hava görüntülerini işleme ve yoğun ortamları analiz etme gibi karmaşık görevler için kritik öneme sahiptir.

Performans ve Kıyaslamalar

Bu modelleri COCO veri kümesi üzerinde karşılaştırdığımızda, YOLO26'nın hem doğruluk hem de verimlilik açısından üstünlüğü açıkça ortaya çıkar. Ultralytics modelleri, eğitim sırasında sürekli olarak daha düşük bellek gereksinimleri ve daha hızlı çıkarım hızları sunar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Not: YOLO26x modeli, etkileyici bir 57.5 mAP elde ederken, YOLOXx modelinden (99.1M) önemli ölçüde daha az parametre (55.7M) gerektirir; bu da Ultralytics mimarisinin inanılmaz parametre verimliliğini vurgular.

Ekosistem ve Kullanım Kolaylığı

YOLO26'yı seçmenin en önemli avantajlarından biri, Ultralytics tarafından sağlanan iyi yönetilen ekosistemdir. YOLOX karmaşık araştırma kod tabanlarında gezinmeyi ve manuel ortam kurulumlarını gerektirirken, Ultralytics kolaylaştırılmış, "sıfırdan kahramana" bir geliştirici deneyimi sunar.

Birleşik Python API'sini kullanarak geliştiriciler, nesne algılama, örnek segmentasyon, görüntü sınıflandırma ve poz tahmini gibi görevler arasında kolayca geçiş yapabilir. YOLOX ise, yalnızca sınırlayıcı kutu algılama ile sınırlıdır.

Eğitim Örneği

Ultralytics ile özel bir veri kümesi üzerinde model eğitmek oldukça verimlidir. Eğitim hattı CUDA bellek kullanımını minimize eder, bu da eski mimarilere veya ağır dönüştürücü modellere kıyasla belirgin bir farkla, tüketici donanımlarında bile daha büyük yığın boyutlarına izin verir.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Ultralytics Platformu bu iş akışını daha da geliştirir; bulut eğitimi, otomatik veri kümesi açıklama ve tek tıklamayla dağıtım seçenekleri sunar. Hızla prototiplemeden üretime geçmeyi hedefleyen ekipler için vazgeçilmez bir araçtır.

İdeal Kullanım Durumları ve Gerçek Dünya Uygulamaları

Doğru modeli seçmek, gerçek dünya dağıtımınızın başarısını belirler.

Uç Yapay Zeka ve IoT

Akıllı güvenlik alarm sistemleri veya uzaktan çevresel sensörler gibi sınırlı donanım üzerinde yerel işlem gerektiren uygulamalar için YOLO26 kesin bir seçimdir. NMS içermeyen mimarisi ve %43 daha hızlı CPU yürütmesi, karmaşık niceleme çözümleri olmadan Raspberry Pi gibi cihazlarda sorunsuz çalışmasını sağlar.

Otonom Robotik

Robotik, yüksek hassasiyet ve düşük gecikme süresi gerektirir. YOLO26'nın Residual Log-Likelihood Estimation (RLE) ile güçlendirilmiş poz tahmini yetenekleri, robotların insan kinematiğini gerçek zamanlı olarak anlamasını sağlar. YOLOX'un yerel anahtar nokta algılama eksikliği, onu bu tür gelişmiş insan-robot etkileşimi görevleri için uygunsuz kılar.

Yüksek İrtifa ve Hava Denetimi

Dronlar aracılığıyla altyapıyı incelerken, küçük kusurları tespit etmek çok önemlidir. YOLO26'daki ProgLoss ve STAL fonksiyonları, küçük nesneler üzerindeki geri çağırmayı (recall) önemli ölçüde iyileştirir. Ek olarak, YOLO26 yerel olarak Yönlendirilmiş Sınırlayıcı Kutuları (OBB) destekler ve sınır sorunlarını çözmek için özel bir açı kaybı ile tamamlanmıştır, bu da onu nesnelerin rastgele döndürüldüğü uydu ve hava görüntüleri için mükemmel kılar.

Eski Sistem Dağıtımları

YOLOX, mevcut C++ dağıtım hatlarının 2021'de özel olarak ayrık başlık çıktıları etrafında inşa edildiği eski ortamlarda hala kullanım bulabilir. Ancak, herhangi bir yeni proje için, modern performans kazanımlarından ve devam eden topluluk desteğinden yararlanmak amacıyla Ultralytics ekosistemine geçiş şiddetle tavsiye edilir.

Diğer Modelleri Keşfetme

YOLO26 mevcut en son teknolojiyi temsil etse de, Ultralytics ekosistemi belirli ihtiyaçlara göre uyarlanmış çeşitli modeller sunar. Dönüştürücü tabanlı mimarilerle ilgilenen geliştiriciler için RT-DETR, uçtan uca algılamaya alternatif bir yaklaşım sunar. Ek olarak, YOLO11, kapsamlı geçmiş kıyaslama gerektiren üretim ortamları için sağlam, yüksek düzeyde test edilmiş bir seçenek olmaya devam etmektedir.

Özetle, YOLOX'tan YOLO26'ya geçiş, alanın hızlı ilerlemesini göstermektedir. Sezgisel bir API'yi, çok yönlü bir özellik setini ve eşsiz verimliliği bir araya getirerek, YOLO26 dünya çapındaki araştırmacılar ve geliştiriciler için önde gelen bir seçenek olarak durmaktadır.


Yorumlar