Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 ile YOLO26 karşılaştırması#

Gerçek zamanlı nesne algılama dünyası, araştırmacıların hız, doğruluk ve dağıtım verimliliğinin sınırlarını sürekli zorlamasıyla çarpıcı bir şekilde evrim geçirdi. Şu anda bu alana öncülük eden en önemli iki mimari, Transformer tabanlı RTDETRv2 ve son teknoloji Evrişimli Sinir Ağı (CNN) olan Ultralytics YOLO26'dır. Bu kılavuz, bir sonraki bilgisayarlı görü projen için en doğru modeli seçmene yardımcı olmak amacıyla mimarileri, performans metrikleri ve ideal kullanım durumları hakkında derinlemesine bir analiz sunar.

Link to this sectionRTDETRv2: Gerçek Zamanlı Algılama Transformer'ları#

RTDETRv2, vizyon Transformer'larının küresel bağlam farkındalığını gerçek zamanlı uygulamalar için gereken hızla birleştirmeyi amaçlayarak orijinal RT-DETR mimarisi üzerine inşa edilmiştir.

Temel Özellikler:

  • Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
  • Organizasyon: Baidu
  • Tarih: 2024-07-24
  • Bağlantılar: Arxiv, GitHub, Dokümanlar

Link to this sectionMimari ve Güçlü Yönler#

Geleneksel çapa (anchor) tabanlı dedektörlerin aksine RTDETRv2, işlem sonrası aşamada Maksimum Olmayan Baskılama (NMS) ihtiyacını doğal olarak ortadan kaldıran Transformer tabanlı bir yaklaşım kullanır. Esnek bir dikkat mekanizmasından yararlanan model, karmaşık sahneleri ve birbiriyle çakışan nesneleri anlamada oldukça etkilidir. "Bag-of-Freebies" iyileştirmeleri, yüksek performanslı GPU'larda kabul edilebilir çıkarım hızlarını korurken COCO veri kümesi üzerindeki doğruluğunu önemli ölçüde artırmıştır.

Link to this sectionSınırlamalar#

While RTDETRv2 achieves impressive academic results, it often presents challenges in production environments. Transformer architectures inherently demand higher memory usage during both training and inference compared to CNNs. This can make deployment on resource-constrained edge AI devices difficult. Additionally, training transformers typically requires larger batch sizes and more CUDA memory, which can be a bottleneck for researchers with limited hardware.

RTDETRv2 hakkında daha fazla bilgi edin

Link to this sectionYOLO26: Uç Nokta Odaklı Yapay Zekanın Zirvesi#

2026'nın başlarında yayınlanan Ultralytics YOLO26, CNN tabanlı nesne algılama ile nelerin mümkün olduğunu yeniden tanımlıyor. Sorunsuz bir üretim dağıtımı ve uç noktada donanım verimliliği için özel olarak hazırlanmış son teknoloji optimizasyonları içerir.

Temel Özellikler:

Link to this sectionMimari Çığırlar#

YOLO26, model dağıtımındaki yaygın sorunları çözen birkaç devrim niteliğinde özellik sunar:

  • Uçtan Uca NMS-İçermeyen Tasarım: YOLOv10'da öncü olan kavramlar üzerine inşa edilen YOLO26, doğal olarak uçtan ucadır. NMS işlem sonrası aşamasını ortadan kaldırarak gecikme değişkenliğini önemli ölçüde azaltır ve üretimde yüksek oranda öngörülebilir çıkarım süreleri sağlar.
  • Up to 43% Faster CPU Inference: Through strategic architectural refinements and the removal of Distribution Focal Loss (DFL), YOLO26 achieves unprecedented CPU speeds, making it the premier choice for edge computing without dedicated GPUs.
  • MuSGD Optimize Edici: Moonshot AI'ın Kimi K2'si gibi Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenen YOLO26, MuSGD optimize edicisini (SGD ve Muon'un bir hibriti) kullanır. Bu, oldukça kararlı eğitim süreçleri ve inanılmaz derecede hızlı yakınsama sağlar.
  • ProgLoss + STAL: Bu gelişmiş kayıp işlevleri, hava görüntüleme ve drone tabanlı gözetim içeren uygulamalar için temel bir yükseltme olan küçük nesne tanımada dikkate değer iyileştirmeler sağlar.
YOLO26'daki Göreve Özgü Geliştirmeler

Standart algılamanın ötesinde YOLO26, uzmanlaşmış iyileştirmeler sunar: segmentasyon görevleri için anlamsal segmentasyon kaybı ve çok ölçekli proto, poz tahmini için Artık Günlük-Olasılık Tahmini (RLE) ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamasındaki sınır sorunlarını çözmek için özelleştirilmiş açı kaybı.

YOLO26 hakkında daha fazla bilgi edin

Link to this sectionPerformans Karşılaştırması#

Bu modelleri değerlendirirken, doğruluk (mAP) ve hesaplama verimliliği arasında güçlü bir performans dengesi elde etmek çok önemlidir. Aşağıdaki tablo, YOLO26'nın çeşitli boyut seçeneklerinde RTDETRv2'den nasıl tutarlı bir şekilde daha iyi performans gösterdiğini ortaya koymaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Yukarıda görüldüğü gibi, YOLO26x modeli, daha az parametre kullanarak ve daha hızlı bir TensorRT çıkarım hızı koruyarak RTDETRv2-x modelini önemli ölçüde geride bırakan dikkat çekici bir 57.5 mAP değerine ulaşır. Ayrıca, YOLO26'nın bellek gereksinimleri gözle görülür derecede düşüktür, bu da onu gerçek zamanlı uç dağıtımlar için en uygun seçenek haline getirir.

Link to this sectionEkosistem ve Kullanım Kolaylığı#

Ham performans hayati önem taşısa da, çevreleyen ekosistem bir modelin araştırmadan üretime ne kadar hızlı taşınabileceğini belirler. İşte Ultralytics Platformu burada benzersiz bir avantaj sağlar.

Link to this sectionİyi Bakımlı, Birleşik Bir Ekosistem#

RTDETRv2 temel olarak araştırma düzeyinde bir depo olarak faaliyet gösterir; bu da özel görevler için karmaşık ortam kurulumları ve manuel betik yazma gerektirebilir. Buna karşılık Ultralytics YOLO26, olgun ve ağır testlerden geçmiş bir Python paketinden faydalanır. Ultralytics ekosistemi, eğitim, doğrulama, tahmin ve dışa aktarma için basit bir API sunarak inanılmaz derecede akıcı bir kullanıcı deneyimi sağlar.

Weights & Biases ve Comet ML için yerleşik entegrasyonlarla deney takibi kusursuzdur. Ayrıca, Ultralytics modelleri son derece çok yönlüdür; RTDETRv2 nesne algılamaya odaklansa da, YOLO26 aynı çerçeve içinde örnek segmentasyonu, poz tahmini ve görüntü sınıflandırmayı yerel olarak destekler.

Link to this sectionKod Örneği: Basitlik İş Başında#

Ultralytics API, geliştiricilerin sadece birkaç satır kodla yükleme, eğitim ve çıkarım yapmasına olanak tanır. Bu, eğitim verimliliğini önemli ölçüde artırır ve pazara çıkış süresini kısaltır.

from ultralytics import RTDETR, YOLO

# Load an RT-DETR model
model_rtdetr = RTDETR("rtdetr-l.pt")

# Load a state-of-the-art YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Run inference on an image seamlessly
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")
results_yolo = model_yolo("https://ultralytics.com/images/bus.jpg")

# Display the YOLO26 results
results_yolo[0].show()

# Export YOLO26 to ONNX format with one click
model_yolo.export(format="onnx")

Link to this sectionKullanım Durumları ve Öneriler#

RT-DETR ile YOLO26 arasında seçim yapmak, proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

RT-DETR şunlar için güçlü bir seçimdir:

  • Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.

Link to this sectionNe Zaman YOLO26 Seçilmeli#

YOLO26 şunlar için önerilir:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionDiğer Mimarileri Keşfetmek#

YOLO26 mevcut performans zirvesini temsil etse de, geliştiriciler önceki yinelemeleri keşfetmekten de değer bulabilirler. Oldukça başarılı olan YOLO11, çeşitli eski sistemler için sağlam ve tamamen desteklenen bir model olmaya devam etmektedir. RTDETR vs YOLO11 karşılaştırmamızı okuyarak yeteneklerini daha derinlemesine inceleyebilirsin. Ayrıca, eski mimarileri analiz ediyorsan EfficientDet vs YOLO26 karşılaştırmasına göz atmak, nesne algılama mimarilerinin ne kadar yol kat ettiğine dair harika bir tarihsel bağlam sağlar.

Link to this sectionSon Düşünceler#

Hem RTDETRv2 hem de YOLO26, yapay zeka alanında inanılmaz ilerlemeler sunuyor. Ancak, üretime sorunsuz bir geçiş, minimum bellek ayak izi ve geniş görev çok yönlülüğüne öncelik veren ekipler için net önerimiz Ultralytics YOLO26'dır. NMS içermeyen mimarisi, yüksek CPU hızları ve sağlam Ultralytics ekosisteminin desteği, yapay zeka projelerinin ölçeklenebilir, verimli ve geleceğe hazır kalmasını sağlar. İster bulut sunucuda ister kaynakları kısıtlı bir Raspberry Pi üzerinde dağıtım yap, YOLO26 kutudan çıktığı andan itibaren tavizsiz bir performans sunar.

Katkıda Bulunanlar

Yorumlar