Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX ve RTDETRv2#

Bilgisayarlı görü uygulamaları için en uygun mimariyi seçmek; doğruluk, çıkarım hızı ve dağıtım yapılabilirliği arasında dikkatli bir denge gerektirir. Bu kapsamlı teknik analizde, oldukça başarılı ve çapasız (anchor-free) bir CNN mimarisi olan YOLOX ile son teknoloji gerçek zamanlı bir tespit transformer'ı olan RTDETRv2 arasındaki temel farkları inceliyoruz.

Her iki model de nesne tespiti alanına önemli katkılarda bulunmuş olsa da, üretime hazır uygulamalar geliştiren yazılımcılar genellikle Ultralytics YOLO26 gibi modern alternatiflerin daha üstün eğitim verimliliği, daha düşük bellek gereksinimleri ve daha sağlam bir dağıtım ekosistemi sunduğunu görüyorlar.

Link to this sectionYOLOX: Araştırma ve Endüstri Arasındaki Boşluğu Kapatmak#

YOLOX, YOLO serisinin oldukça popüler ve çapasız bir uyarlaması olarak ortaya çıktı ve piyasaya sürüldüğü dönemde etkileyici performans artışları sağlayan basitleştirilmiş bir tasarım sundu.

  • Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
  • Kuruluş: Megvii
  • Tarih: 18 Temmuz 2021
  • Bağlantılar: Arxiv, GitHub, Dokümanlar

Link to this sectionMimari Yenilikler#

YOLOX, YOLO ailesini çapasız bir paradigmaya taşıyarak ayrıştırılmış bir başlık (decoupled head) ve gelişmiş SimOTA etiket atama stratejisini entegre etti. Çapa kutularını (anchor boxes) ortadan kaldıran bu mimari, tasarım parametrelerinin sayısını önemli ölçüde azalttı ve çeşitli kıyaslama veri setleri genelinde genelleştirme yeteneğini geliştirdi. Hafif sürümleri olan YOLOX-Nano ve YOLOX-Tiny, uç cihazlarda görü yapay zeka uygulamaları dağıtmak için popüler tercihler haline geldi.

Eski Sistemlere Dair Hususlar

YOLOX kayda değer ilerlemeler getirse de, ağır veri artırma (augmentation) hatlarına ve eski işlem sonrası rutinlerine (geleneksel NMS gibi) bağımlılığı, doğal olarak uçtan uca (end-to-end) çalışan modellere kıyasla daha yüksek gecikmelere yol açabilir.

YOLOX hakkında daha fazla bilgi edinin

Link to this sectionRTDETRv2: Gerçek Zamanlı Görü Transformer'larını İlerletmek#

Selefinin temelini üzerine inşa eden RTDETRv2, gerçek zamanlı çıkarım hızlarından ödün vermeden son derece rekabetçi bir doğruluk elde etmek için Görü Transformer'larının (ViTs) gücünden yararlanır.

  • Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
  • Organizasyon: Baidu
  • Tarih: 2024-07-24
  • Bağlantılar: Arxiv, GitHub

Link to this sectionMimari Yenilikler#

RTDETRv2, Non-Maximum Suppression (NMS) adımını doğal olarak devre dışı bırakan transformer tabanlı bir mimari kullanarak tespit hattını temelden yeniden tasarlıyor. Bu, nesne sorgularının başlatılmasını iyileştiren hibrit bir kodlayıcı ve IoU farkındalıklı sorgu seçimi ile elde edilir. Model, çok ölçekli özellikleri etkili bir şekilde işleyerek gece vakti trafik videosu tespiti gibi karmaşık ortamlardaki ince detayları yakalayabilir.

Ancak transformer'lar yapıları gereği kaynak tüketimi yüksektir. RTDETRv2'yi eğitmek, genellikle CNN tabanlı alternatiflere göre çok daha fazla GPU belleği ve hesaplama döngüsü gerektirir; bu da sıkı bütçe kısıtlamaları altında çalışan veya sık model ayarı gerektiren ekipler için bir engel teşkil edebilir.

RTDETR hakkında daha fazla bilgi edinin

Link to this sectionPerformans Karşılaştırma Tablosu#

Bu mimarileri objektif bir şekilde değerlendirmek için COCO veri seti üzerindeki performanslarını inceliyoruz. Aşağıdaki tablo, doğruluk (mAP), parametre sayısı ve hesaplama karmaşıklığı arasındaki ödünleşimleri göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

RTDETRv2 etkileyici bir doğruluk sunsa da, YOLOX, özellikle Nano ve Tiny sürümleriyle hafif parametre profili avantajını koruyor.

Link to this sectionKullanım Durumları ve Öneriler#

YOLOX ve RT-DETR arasında seçim yapmak; özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionNe Zaman YOLOX Seçilmeli#

YOLOX şunlar için güçlü bir tercihtir:

  • Anchor-Free Algılama Araştırmaları: Yeni algılama başlıkları veya kayıp fonksiyonlarını denemek için YOLOX'un temiz, anchor-free mimarisini temel olarak kullanan akademik araştırmalar.
  • Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapmak.
  • SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran araştırma projeleri.

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

RT-DETR şunlar için önerilir:

  • Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionUltralytics Avantajı: YOLO26#

Hem YOLOX hem de RTDETRv2 belirgin güçlü yönler sunsa da, yeni çıkan Ultralytics YOLO26 hız, doğruluk ve dağıtım kolaylığı arasındaki tarihsel ödünleşimleri çözerek yapay zeka teknolojisinde çıtayı yeniden belirliyor.

Link to this sectionUçtan Uca NMS'siz Mimari#

Transformer modellerinden ilham alan ve aynı zamanda CNN'lerin verimliliğini koruyan YOLO26, doğal olarak uçtan uca NMS'siz bir tasarım sunar. Non-Maximum Suppression işlemini bir işlem sonrası adımı olmaktan çıkaran YOLO26, dağıtım hatlarını önemli ölçüde basitleştirerek karmaşık eşik ayarlarının ek yükü olmaksızın çeşitli uç cihazlarda tutarlı çıkarım gecikmesi sağlar.

Link to this section%43'e Varan Daha Hızlı CPU Çıkarımı#

RTDETRv2 gibi yüksek donanımlı GPU'lara büyük ölçüde dayanan transformer mimarilerinin aksine, YOLO26 özellikle uç bilişim ortamları için optimize edilmiştir. Distribution Focal Loss (DFL) özelliğinin kaldırılmasıyla YOLO26, model dışa aktarımını kolaylaştırır ve %43'e kadar daha hızlı CPU çıkarımı sağlar; bu da onu Raspberry Pi veya standart mobil cihazlar gibi donanımlara entegrasyon için ideal bir seçenek haline getirir.

Link to this sectionMuSGD ile Eğitim Verimliliği#

Transformer modellerini eğitmek genellikle aşırı CUDA bellek tüketimine ve uzun süren eğitim sürelerine yol açar. YOLO26, Stochastic Gradient Descent ve LLM'den esinlenen Muon iyileştiricisinin hibriti olan yeni MuSGD Optimizer'ı sunar. Bu yenilik, RTDETRv2'ye kıyasla donanım gereksinimlerini önemli ölçüde düşürerek son derece istikrarlı bir eğitim ve daha hızlı yakınsama sağlar.

Link to this sectionEşsiz Ekosistem ve Çok Yönlülük#

Ultralytics ekosistemi, sezgisel ve modern bir geliştirici deneyimi sunar. Kapsamlı dokümantasyon, aktif topluluk desteği ve bulut tabanlı Ultralytics Platform ile tüm yapay zeka yaşam döngüsünü yönetmek hiç bu kadar kolay olmamıştı. Ayrıca YOLO26 oldukça çok yönlüdür. RTDETRv2 sadece nesne tespitine odaklanırken, YOLO26 örnek bölümleme, poz tahmini, görüntü sınıflandırma ve Yönelimli Sınırlayıcı Kutu (OBB) görevlerini doğal olarak destekler. Yeni ProgLoss + STAL kayıp fonksiyonları ile güçlendirilmiş olan YOLO26, hava görüntüleri ve endüstriyel hata tespiti için kritik bir özellik olan küçük nesne tanıma konusunda da mükemmeldir.

Desteklenen Diğer Modeller

Ultralytics çerçevesi ayrıca bir önceki nesil olan YOLO11 ve YOLOv8 modellerini de destekler, böylece kullanıcılar eski hatlarını kolayca karşılaştırabilir ve geçiş yapabilirler.

Link to this sectionUltralytics ile Sorunsuz Entegrasyon#

Modelleri dağıtmak karmaşık ve parçalı kod tabanlarıyla uğraşmayı gerektirmemelidir. Ultralytics Python API, sadece birkaç satır kodla son teknoloji modelleri yüklemenize, eğitmenize ve dışa aktarmanıza olanak tanır.

from ultralytics import YOLO

# Load the latest YOLO26 nano model for optimal edge performance
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with minimal memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT for deployment
model.export(format="onnx", optimize=True)

Ultralytics'ten yararlanarak, araştırma depolarıyla genellikle ilişkili olan karmaşık ortam yapılandırmalarından kaçınır ve pazara çıkış sürenizi hızlandırırsınız.

Link to this sectionSonuç#

YOLOX ve RTDETRv2, gerçek zamanlı nesne tespiti sürecinde önemli kilometre taşlarını temsil eder. YOLOX oldukça verimli çapasız CNN'lerin uygulanabilirliğini kanıtlarken, RTDETRv2 transformer modellerini gerçek zamanlı kısıtlamalara başarıyla uyarladı.

Akıllı perakende analitiğinden gömülü robotik sistemlere kadar modern uygulamalar için Ultralytics YOLO26 kesin çözümü sunar. NMS'siz çıkarımı, benzersiz CPU hızları, azaltılmış bellek ayak izi ve Ultralytics Platform'un sağlam desteğiyle birleştiren YOLO26, geliştiricileri yeni nesil güvenilir ve yüksek performanslı bilgisayarlı görü sistemleri oluşturmak için donatır.

Katkıda Bulunanlar

Yorumlar