Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 ile YOLOv5 karşılaştırması#

Bilgisayarlı görü evrimi, büyük ölçüde doğruluk ile gerçek zamanlı çıkarım hızı arasındaki dengeyi yakalama arayışıyla tanımlanmıştır. Geliştiriciler RTDETRv2 ve Ultralytics YOLOv5'i karşılaştırırken, aslında transformer mimarilerinin gelişmiş küresel bağlam yeteneklerini, Evrişimli Sinir Ağlarının (CNN) son derece optimize edilmiş, sahada test edilmiş verimliliğiyle kıyaslıyorlar.

Bu kılavuz, özel kullanım durumun için en iyi nesne algılama modelini seçmene yardımcı olmak amacıyla; performans metriklerini, eğitim metodolojilerini, bellek gereksinimlerini ve ideal dağıtım senaryolarını detaylandırarak bu iki önde gelen mimarinin derinlemesine teknik analizini sunar.

Link to this sectionRTDETRv2: Gerçek Zamanlı Tespit için Transformer Yaklaşımı#

Orijinal Real-Time Detection Transformer (RT-DETR) üzerine inşa edilen RTDETRv2, çıkarım gecikmesinden ödün vermeden temel mimariyi geliştirmek için bir dizi "bag-of-freebies" yöntemini tanıtır.

  • Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
  • Organizasyon: Baidu
  • Tarih: 2024-07-24
  • Bağlantılar: Arxiv Makalesi, GitHub Deposu

Link to this sectionMimari ve Yetenekler#

RTDETRv2, hibrit bir CNN-Transformer mimarisinden yararlanır. CNN, ince detaylı görsel özellikleri çıkarmak için bir omurga (backbone) görevi görürken, transformer kodlayıcı-kod çözücü katmanları küresel bağlamı anlamak için tüm özellik haritasını işler. RTDETRv2'nin en önemli özelliklerinden biri, Non-Maximum Suppression (NMS) son işleme ihtiyacını tamamen ortadan kaldıran uçtan uca doğasıdır.

RTDETRv2 özellikle nesnelerin birbiriyle örtüştüğü karmaşık ve yoğun sahnelerde etkileyici bir doğruluk elde etse de, bazı önemli ödünleşimleri vardır. Transformer'ların doğasında olan dikkat mekanizması, eğitim sırasında standart CNN'lere kıyasla önemli ölçüde daha yüksek CUDA belleği gerektirir. Ayrıca, NVIDIA A100 veya T4 gibi üst düzey GPU'larda iyi performans gösterse de, mimarisi standart CPU'larda ve kısıtlı uç cihazlarda belirgin şekilde daha yavaştır.

RTDETRv2 hakkında daha fazla bilgi edin

Link to this sectionUltralytics YOLOv5: Verimlilikte Endüstri Standardı#

Ultralytics YOLOv5, piyasaya sürüldüğünde uygulamalı makine öğrenimi ortamını temelden değiştirerek, son derece sezgisel bir çerçeve aracılığıyla yüksek performanslı bilgisayarlı görü teknolojisini dünya çapındaki geliştiriciler için erişilebilir kıldı.

Link to this sectionEkosistem ve Performans Dengesi#

YOLOv5 tamamen PyTorch çerçevesi üzerine inşa edilmiştir ve son derece verimli bir CNN mimarisine dayanır. Yapay zeka endüstrisindeki en kapsamlı dokümantasyonlardan bazılarına ve yalın bir API'ye sahip olup, kullanım kolaylığı için en baştan tasarlanmıştır.

YOLOv5'in en büyük avantajı, benzersiz çok yönlülüğü ve düşük bellek gereksinimidir. Bir YOLOv5 modelini eğitmek, transformer tabanlı modellere göre çok daha az VRAM gerektirir, bu da onu sınırlı donanım bütçesine sahip araştırmacılar ve mühendisler için erişilebilir kılar. Ayrıca, RTDETRv2 yalnızca sınırlayıcı kutu (bounding box) algılamasına odaklanırken, YOLOv5 örnek segmentasyonu ve görüntü sınıflandırmayı destekleyen çok yönlü bir güç merkezine dönüşmüştür.

Kurumsal Model Yönetimi

En gelişmiş ve yalın iş akışını deneyimlemek için YOLOv5 modellerini doğrudan Ultralytics Platform kullanarak eğitebilir, doğrulayabilir ve dağıtabilirsin. Platform, bulut tabanlı eğitim özellikleri ve kod gerektirmeyen dağıtım hatları sunar.

YOLOv5 hakkında daha fazla bilgi edin

Link to this sectionPerformans ve Metrik Karşılaştırması#

Standart COCO veri seti üzerindeki ham performansı analiz ederken, bu modellerin kaynakları nasıl önceliklendirdiği konusunda net farklılıklar görebiliriz.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionÖdünleşimleri Analiz Etmek#

The data reveals that RTDETRv2-x achieves a peak mean Average Precision (mAP) of 54.3%, slightly outperforming YOLOv5x's 50.7%. However, this minor accuracy gain comes at a massive computational cost. YOLOv5x operates with lower latency (11.89 ms vs 15.03 ms on TensorRT) and requires a fraction of the memory footprint. For ultra-low-power edge deployments, YOLOv5n (Nano) remains unchallenged, completing inferences in just 1.12ms with a minuscule 2.6M parameter footprint—a tier that RTDETRv2 does not even attempt to compete in.

Link to this sectionEğitim Verimliliği ve Kod Basitliği#

Ultralytics ekosisteminin temel güçlü yanlarından biri, birleştirilmiş API yapısıdır. Belirli bir yoğun hesaplama gerektiren görev için RT-DETR'nin transformer mimarisini kullanmaya karar versen bile, bunu tamamen Ultralytics Python paketi içinde yapabilir ve sadece tek bir kod satırıyla modeller arasında sorunsuz geçiş yapabilirsin.

from ultralytics import RTDETR, YOLO

# Load the Ultralytics YOLOv5 small model
model_yolo = YOLO("yolov5s.pt")

# Load the RT-DETR large model via Ultralytics
model_rtdetr = RTDETR("rtdetr-l.pt")

# Train YOLOv5 effortlessly on your custom data
model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with both models seamlessly
results_yolo = model_yolo("https://ultralytics.com/images/bus.jpg")
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")

results_yolo[0].show()

Ultralytics kütüphanesinden yararlanarak, deney takibi entegrasyonları (Weights & Biases ve Comet ML gibi) ve ONNX ile OpenVINO gibi dağıtım formatlarına tek tıkla dışa aktarma özelliklerini içeren iyi korunmuş bir ekosisteme otomatik olarak erişim sağlarsın.

Link to this sectionGerçek Dünya Uygulamaları ve İdeal Kullanım Durumları#

Link to this sectionRTDETRv2'nin Öne Çıktığı Yerler#

RTDETRv2, donanım kısıtlamalarının olmadığı ve tek hedefin mümkün olan en yüksek hassasiyet olduğu ortamlar için en uygun modeldir.

  • Sunucu Tarafı Tıbbi Görüntüleme: Yüksek çözünürlüklü röntgenlerde mikroskobik anormalliklerin tespiti.
  • Satellite Imagery: Tracking dense, overlapping objects in aerial surveillance tasks on powerful cloud clusters.

Link to this sectionYOLOv5'in Hüküm Sürdüğü Yerler#

YOLOv5, çeşitli donanımlar üzerinde pratik, gerçek dünya dağıtımları için tartışmasız şampiyondur.

  • Uç Yapay Zeka Cihazları: Belleğin kesin olarak sınırlı olduğu Raspberry Pi veya NVIDIA Jetson cihazlarında güvenlik alarm sistemlerinin dağıtımı.
  • Mobil Uygulamalar: CoreML veya TFLite aracılığıyla akıllı telefonlarda doğrudan hızlı, gerçek zamanlı sınırlayıcı kutu ve segmentasyon çıkarımı çalıştırma.
  • Yüksek Hızlı Endüstriyel Üretim: Milisaniyelik gecikmenin operasyonel başarı için kritik olduğu hızlı üretim hatlarında parça denetimi.
Diğer Ultralytics Modellerini Keşfetme

YOLOv5 efsanevi bir model olsa da, Ultralytics ekosistemi yapay zekanın sınırlarını sürekli zorlamaya devam ediyor. 2026'da yeni bir proje için modelleri karşılaştırıyorsan, en son teknoloji Ultralytics YOLO26 modelini keşfetmeyi düşünmelisin. YOLO26, yerel bir Uçtan Uca NMS'siz Tasarıma (transformer'lara benzer ancak CNN hızında) sahiptir, inanılmaz derecede kararlı eğitim için devrim niteliğindeki MuSGD Optimize Ediciyi içerir ve %43'e kadar daha hızlı CPU çıkarımı sağlar. Alternatif olarak, YOLO11, Poz Tahmini ve OBB algılama gerektiren çok yönlü dağıtımlar için harika ve yüksek destekli bir seçenek olmaya devam etmektedir.

Sonuç olarak, RTDETRv2 transformer katmanlarını kullanarak doğruluk sınırlarını zorlarken, Ultralytics YOLO çerçevesi hız, hafif bellek gereksinimleri ve prototipten üretime geçiş süresini önemli ölçüde azaltan mükemmel tasarlanmış bir geliştirici deneyimi ile benzersiz bir denge sunar.

Yorumlar