Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 ile YOLOv7 karşılaştırması#

Bilgisayarlı görü dünyası, hem Evrişimli Sinir Ağlarındaki (CNN'ler) hem de Görsel Transformer'lardaki (ViT'ler) sürekli yeniliklerin etkisiyle son birkaç yılda önemli ölçüde genişledi. Dağıtımın için doğru mimariyi seçmek, hız, doğruluk ve hesaplama yükü arasındaki ince farkları anlamanı gerektirir. Bu kılavuz, oldukça saygın iki mimari olan RTDETRv2 ve YOLOv7 arasındaki teknik farkları incelerken, aynı zamanda yeni Ultralytics YOLO26 içerisindeki modern gelişmeleri de öne çıkarıyor.

Link to this sectionRTDETRv2: Gerçek Zamanlı Tespit için Transformer Yaklaşımı#

RTDETRv2 (Gerçek Zamanlı Tespit Transformer'ı sürüm 2), geleneksel işlem sonrası adımlarına güvenmeden transformer tabanlı mimarilerin gerçek zamanlı senaryolarda etkili bir şekilde rekabet edebileceğini kanıtlamak için selefinin temelleri üzerine inşa edilmiştir.

Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
Kuruluş: Baidu Tarih: 2024-07-24 Arxiv: https://arxiv.org/abs/2407.17140
GitHub: RTDETRv2 Deposu

Link to this sectionMimari Öne Çıkanlar#

RTDETRv2 utilizes a hybrid encoder and a transformer decoder architecture. By leveraging self-attention mechanisms, the model processes the entire image holistically, allowing it to understand complex spatial relationships better than strictly localized convolutional kernels. One of its most defining features is its natively NMS-free design. By eliminating Non-Maximum Suppression (NMS), RTDETRv2 removes a common bottleneck that introduces variable inference latency during deployment.

Link to this sectionGüçlü ve Zayıf Yönler#

RTDETRv2'nin birincil gücü, karmaşık sahnelerdeki yoğun ve örtüşen nesneleri işleme yeteneğinde yatar. Transformer dikkat katmanları tarafından sağlanan küresel bağlam, özellikle örtüşmelerin sık olduğu senaryolarda onu oldukça doğru kılar.

However, this comes at a computational cost. Transformer models traditionally require a higher memory footprint during training and inference compared to CNNs. Furthermore, RTDETRv2 generally requires more epochs to converge during distributed training, leading to longer iteration cycles for developers tuning custom datasets.

RTDETRv2 hakkında daha fazla bilgi edin

Link to this sectionYOLOv7: Hız için bir CNN Temel Modeli#

RTDETRv2'den bir yıl önce yayınlanan YOLOv7, klasik YOLO çerçevesinde birkaç yapısal optimizasyon getirerek yayınlandığı dönemde CNN tabanlı gerçek zamanlı dedektörler için güçlü bir kıyaslama standardı belirledi.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: YOLOv7 Deposu

Link to this sectionMimari Öne Çıkanlar#

YOLOv7's architecture is built around the concept of Extended Efficient Layer Aggregation Network (E-ELAN). This approach optimizes the gradient path, allowing the model to learn more effectively without significantly increasing computational complexity. The authors also introduced "trainable bag-of-freebies," a set of methods that improve model accuracy during training without affecting the inference speed on edge devices.

Link to this sectionGüçlü ve Zayıf Yönler#

YOLOv7, standart nesne tespiti görevleri için son derece yetenekli bir model olmaya devam etmekte ve tüketici sınıfı GPU'larda mükemmel işlem hızları sunmaktadır. CNN yapısı, RTDETRv2 gibi transformer tabanlı modellere kıyasla eğitim sırasında genellikle daha az CUDA belleği gerektirdiği anlamına gelir.

Bu avantajlara rağmen YOLOv7, işlem sonrası için hala NMS'ye güvenir. Yüksek yoğunluklu tahminlerin olduğu ortamlarda, NMS adımı işlem süresinde dalgalanmalara neden olabilir ve bu da katı gerçek zamanlı garantileri zorlaştırır. Ayrıca, modern çerçevelere kıyasla örnek bölümleme ve poz tahmini gibi çeşitli görevleri ele alma süreci dağınık olabilir.

YOLOv7 hakkında daha fazla bilgi edinin

Link to this sectionPerformans Karşılaştırması#

Evaluating these models requires looking at the delicate balance between mean Average Precision (mAP), parameter count, and inference speed.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
Performans Bağlamı

RTDETRv2-x en yüksek mAP değerine ulaşsa da, aynı zamanda en büyük parametre sayısına ve FLOP değerine sahiptir. RTDETRv2-s gibi daha küçük varyantlar TensorRT'de rekabetçi hızlar sunar, ancak özel GPU'ları olmayan düşük güçlü ortamları hedefleyen kullanıcıların CPU çıkarım yeteneklerini dikkatlice değerlendirmeleri gerekir.

Link to this sectionModern Çözüm: YOLO26 ile Tanışın#

While RTDETRv2 and YOLOv7 were pivotal in pushing the boundaries of computer vision applications, the AI landscape evolves rapidly. Released in January 2026, YOLO26 synthesizes the best aspects of both CNN efficiency and transformer-like NMS-free architectures.

Yeni sistemler kuran geliştiriciler ve araştırmacılar için entegre Ultralytics Platformu ve Python ekosistemi, teknik borcu önemli ölçüde azaltan birleşik bir deneyim sağlar.

Link to this sectionYOLO26'daki Temel Yenilikler#

  • Uçtan Uca NMS'siz Tasarım: YOLO26 yerel olarak uçtan ucadır ve daha hızlı, daha basit bir dağıtım için NMS işlem sonrasını ortadan kaldırır. Bu çığır açan yaklaşım ilk olarak YOLOv10'da öncü olarak kullanılmış ve nesne yoğunluğundan bağımsız olarak kararlı gecikme süreleri sağlamıştır.
  • Up to 43% Faster CPU Inference: Specifically optimized for edge computing and devices without GPUs, making it far more versatile for field deployments than heavy transformer models.
  • MuSGD Optimize Edici: SGD ve Muon'un (Moonshot AI'nin Kimi K2'sinden esinlenilmiştir) bir melezi olup, daha kararlı eğitim ve daha hızlı yakınsama için LLM eğitim yeniliklerini bilgisayarlı görüye taşır.
  • DFL Kaldırma: Dağılımsal Odak Kaybı (Distribution Focal Loss) kaldırılmış, bu da gömülü NPU'lara ve TensorRT ortamlarına daha sorunsuz aktarım için basitleştirilmiş bir hesaplama grafiğiyle sonuçlanmıştır.
  • ProgLoss + STAL: Improved loss functions yield notable enhancements in small-object recognition, which is critical for robotics, IoT, and aerial imagery analysis.
  • Göreve Özel İyileştirmeler: YOLO26 sadece tespit için değildir. Bölümleme için çok ölçekli prototipler, poz takibi için Kalıntı Log-Olabilirlik Tahmini (RLE) ve yönlendirilmiş sınırlayıcı kutu (OBB) sınır sorunlarını ele alan özel açı kaybı özelliklerine sahiptir.

Link to this sectionKolaylaştırılmış Geliştirici Deneyimi#

YOLO26 (veya oldukça popüler olan YOLO11) gibi bir Ultralytics modeli seçmenin gerçek avantajı, bakımı iyi yapılan ekosistemidir. Özel bir veri kümesini eğitmek minimum ortak kod gerektirir:

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export seamlessly for edge deployment
model.export(format="onnx", dynamic=True)

YOLO26 hakkında daha fazla bilgi edin

Link to this sectionİdeal Kullanım Senaryoları ve Uygulamalar#

Bu mimariler arasında seçim yapmak, büyük ölçüde hedef donanıma ve özel operasyonel gereksinimlere bağlıdır.

Link to this sectionRTDETRv2 Ne Zaman Düşünülmeli#

RTDETRv2, güçlü GPU'larla donatılmış sunucu tarafı işleme ortamlarında oldukça etkilidir. Küresel dikkat mekanizması, örtüşen özelliklerin derin bağlamsal analiz gerektirdiği, yoğun kalabalık etkinlik izleme veya özel tıbbi görüntüleme gibi karmaşık sahne anlama görevleri için uygundur.

Link to this sectionYOLOv7 Ne Zaman Dikkate Alınmalı#

YOLOv7 genellikle eski akademik araştırmalarda temel karşılaştırma modeli olarak korunur. Ayrıca, mevcut hatların belirli PyTorch sürümleri için kodlandığı ve daha yeni çerçevelerin çoklu görev esnekliğine ihtiyaç duymayan eski endüstriyel dağıtımlarda da bulunur.

Link to this sectionNeden YOLO26 Önerilen Standarttır#

For modern smart city infrastructure, drone navigation, and high-speed manufacturing, YOLO26 offers an unmatched balance. Its lower memory requirements make hyperparameter tuning and training accessible on consumer hardware, while its NMS-free inference ensures rapid execution on constrained edge devices like the Raspberry Pi or NVIDIA Jetson.

Daha Fazla Karşılaştırmayı Keşfet

Bu modellerin diğer mimarilere karşı nasıl performans gösterdiğini merak ediyor musun? Vizyon yapay zeka projen için en uygun olanı bulmak için YOLO11 ve RTDETR ve YOLOv8 ve YOLOv7 hakkındaki detaylı kılavuzlarımıza göz at.

Yorumlar