Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 ile YOLOv9 karşılaştırması#

Bilgisayarlı görü alanı, öncelikle Evrişimli Sinir Ağları (CNN'ler) ile transformer tabanlı modeller arasında mimari felsefelerde büyüleyici bir ayrışmaya tanık oldu. RTDETRv2 ve YOLOv9'u karşılaştırırken, geliştiriciler aslında küresel dikkat mekanizmaları ile programlanabilir gradyan bilgisi arasındaki ödünleşimleri değerlendiriyorlar. Her iki model de kendi paradigmalarının zirvesini temsil ediyor ve gerçek zamanlı nesne algılamanın sınırlarını zorluyor.

Link to this sectionModellere Giriş#

Link to this sectionRTDETRv2: Gerçek Zamanlı Algılama Transformer'ı#

Baidu araştırmacıları tarafından geliştirilen RTDETRv2, orijinal RT-DETR üzerine inşa edilmiş olup, temel Gerçek Zamanlı Algılama Transformer'ını geliştirmek için bir "Bag-of-Freebies" (bedelsiz iyileştirmeler paketi) sunar. Transformer'ların geleneksel darboğazı olan çıkarım hızını ele alarak onları gerçek zamanlı uygulamalar için uygun hale getirir.

  • Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
  • Organizasyon: Baidu
  • Tarih: 2024-07-24
  • Bağlantılar: Arxiv, GitHub

RTDETRv2'nin belirleyici bir özelliği, doğal olarak uçtan uca NMS içermeyen tasarımıdır. Son işlem sırasında NMS'yi (Non-Maximum Suppression) tamamen kaldırarak, model çıkarım gecikmesini stabilize eder ve dağıtım sürecini basitleştirir. Küresel dikkat mekanizması, tüm görüntü bağlamını aynı anda değerlendirdiği için modelin karmaşık sahne anlama ve yoğun kalabalık senaryolarında mükemmelleşmesini sağlar.

RTDETRv2 hakkında daha fazla bilgi edin

Link to this sectionYOLOv9: Programlanabilir Gradyan Bilgisi#

Oldukça verimli bir CNN tabanlı mimari olan YOLOv9, derin sinir ağlarında doğal olarak bulunan bilgi darboğazı problemini ele alır. Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağını (GELAN) tanıtır.

YOLOv9, kanıtlanmış evrişimli sinir ağı temellerine dayanır ancak parametre verimliliğini maksimize eder. İleri besleme sürecinde kritik bilgileri koruyarak güvenilir ağırlık güncellemeleri sağlar ve bu sayede inanılmaz derecede hafif ancak oldukça doğru bir model ortaya koyar. Ancak RTDETRv2'nin aksine, YOLOv9 hala standart NMS son işlemine dayanır.

YOLOv9 hakkında daha fazla bilgi edin

Link to this sectionPerformans ve Kaynak Verimliliği#

Bu modelleri üretim ortamı için değerlendirirken, ortalama Hassasiyeti (mAP) hesaplama maliyetiyle dengelemek kritiktir. Aşağıdaki tablo, MS COCO veri kümesi üzerindeki performanslarını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionBellek Gereksinimleri ve Eğitim Verimliliği#

RTDETRv2 gibi Transformer'lar, eğitim sırasında yüksek bellek kullanımıyla bilinirler ve tam yakınsama için genellikle önemli miktarda CUDA belleği ve daha uzun eğitim süreleri gerektirirler. Buna karşılık, YOLOv9 ve diğer Ultralytics YOLO modelleri gibi CNN mimarileri, son kullanıcı donanımlarında daha büyük yığın boyutlarıyla eğitim yapmana olanak tanıyan, olağanüstü derecede düşük bellek kullanımı sunar.

Verimli Eğitim

Donanım kullanımını maksimize etmek için, kolaylaştırılmış bulut eğitimi adına Ultralytics Platformu kullanmayı değerlendir. Ortam kurulumunu ve optimum yığın boyutlandırmasını otomatik olarak halleder.

Link to this sectionUltralytics Avantajı: Ekosistem ve Kullanım Kolaylığı#

Resmi RTDETRv2 veya YOLOv9 GitHub sayfaları gibi bağımsız depoları araştırmak oldukça eğitici olsa da, üretim ortamları kararlılık, kullanım kolaylığı ve iyi bakılan bir ekosistem gerektirir. Bu modelleri Ultralytics Python API aracılığıyla entegre etmek, sorunsuz bir geliştirici deneyimi sunar.

Link to this sectionBirleşik API ve Çok Yönlülük#

Ultralytics çerçevesi, veri yükleme, artırma ve dağıtık eğitim karmaşıklıklarını soyutlar. Ayrıca, orijinal RTDETRv2 yalnızca algılamaya odaklanmış olsa da, Ultralytics ekosistemi kullanıcıların Nesne Algılama, Örnek Bölütleme ve Poz Tahmini arasında kolayca geçiş yapmalarına olanak tanır.

from ultralytics import RTDETR, YOLO

# Train a YOLOv9 model on custom data
model_yolo = YOLO("yolov9c.pt")
model_yolo.train(data="coco8.yaml", epochs=50, imgsz=640)

# Easily switch to RT-DETR for complex scene evaluation
model_rtdetr = RTDETR("rtdetr-l.pt")
results = model_rtdetr.predict("https://ultralytics.com/images/bus.jpg")

# Export to production-ready formats like TensorRT
model_yolo.export(format="engine")

With robust documentation, automatic experiment tracking, and seamless export capabilities to formats like ONNX, TensorRT, and OpenVINO, Ultralytics drastically reduces the time from prototype to production.

Link to this sectionİdeal Kullanım Senaryoları#

Link to this sectionRTDETRv2'nin Öne Çıktığı Alanlar#

Küresel dikkat mekanizması sayesinde RTDETRv2, sunucu tarafı işleme ve küresel bağlamın çok önemli olduğu ortamlar için bir güç merkezidir. Şu alanlarda mükemmelleşir:

  • Tıbbi Görüntüleme: Çevredeki bağlamın kritik olduğu durumlarda ince anomalilerin tanımlanması.
  • Hava Gözetleme: Geleneksel CNN evrişimlerinin uzamsal önyargıları olmaksızın yüksek çözünürlüklü drone görüntülerindeki küçük nesnelerin tespit edilmesi.
  • Yoğun Kalabalık Analizi: Ciddi tıkanıklıkların normalde çapa tabanlı modellerin kafasını karıştırdığı durumlarda bireylerin takibi.

Link to this sectionYOLOv9'un Öne Çıktığı Alanlar#

YOLOv9, kaynak kısıtlı uç (edge) dağıtımlarının şampiyonudur. Hesaplama verimliliği onu şu alanlar için ideal kılar:

  • Robotik: Minimum gecikmenin gerekli olduğu gerçek zamanlı navigasyon ve engellerden kaçınma.
  • Akıllı Şehir IoT: Trafik izleme için NVIDIA Jetson gibi uç cihazlarda dağıtım yapma.
  • Endüstriyel Denetim: Yüksek saniye başına kare (FPS) gerektiren hızlı montaj hattı kalite kontrolü.

Link to this sectionGelecek: Ultralytics YOLO26 ile Tanışın#

YOLOv9 ve RTDETRv2 devasa birer sıçramayı temsil etse de, ortam hızla gelişti. Modern dağıtımlar için yeni piyasaya sürülen Ultralytics YOLO26, her iki mimari felsefenin nihai sinerjisini temsil eder.

Transformer'ların ve CNN'lerin en iyi yönlerini alarak, YOLO26 yeni bir standart oluşturur:

  • Uçtan Uca NMS İçermeyen Tasarım: RTDETRv2 gibi, YOLO26 da doğal olarak uçtan ucadır ve daha hızlı, daha basit ve oldukça öngörülebilir dağıtım hatları için NMS son işlemini tamamen ortadan kaldırır.
  • MuSGD Optimize Edici: Büyük Dil Modeli (LLM) eğitim tekniklerinden (Moonshot AI'nin Kimi K2'si gibi) esinlenen YOLO26, SGD ve Muon'un bir hibritini kullanır. Bu, bilgisayarlı görüye benzersiz bir eğitim kararlılığı ve hızlı yakınsama getirir.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Ağır transformer'ların aksine YOLO26, uç bilişim ve GPU'suz cihazlar için yoğun bir şekilde optimize edilmiştir.
  • DFL Kaldırılması: Dağıtım Odak Kaybının (Distribution Focal Loss) kaldırılması, model grafiğini önemli ölçüde basitleştirerek düşük güçlü uç cihazlara ve gömülü Sinir İşleme Birimlerine (NPU'lar) kusursuz dışa aktarımı sağlar.
  • ProgLoss + STAL: Bu geliştirilmiş kayıp fonksiyonları, IoT ve hava veri kümeleri için kritik bir özellik olan küçük nesne tanımayı büyük ölçüde artırır.

Yeni bir bilgisayarlı görü projesi başlatmak isteyen ekipler için YOLO26'yı değerlendirmelerini şiddetle öneriyoruz. Bir transformer'ın NMS içermeyen zarafetini, yüksek düzeyde optimize edilmiş bir YOLO mimarisinin ateş hızındaki hızı ve eğitim verimliliğiyle birleştirir.

YOLO26 hakkında daha fazla bilgi edin

Link to this sectionÖzet#

RTDETRv2 ve YOLOv9 arasında seçim yapmak büyük ölçüde dağıtım donanımına ve özel doğruluk ihtiyaçlarına bağlıdır. RTDETRv2, sunucu destekli uygulamalar için en üst düzeyde doğruluk ve bağlam farkındalığı sağlarken, YOLOv9 uç cihazlar için olağanüstü verimlilik sunar.

Bununla birlikte, olgun Ultralytics ekosisteminden yararlanarak geliştiriciler her ikisiyle de zahmetsizce deney yapabilirler. Dahası, YOLO11 gibi daha yeni modellerin ve doğal olarak uçtan uca olan YOLO26'nın tanıtılmasıyla, yüksek hızlı çıkarım, çok yönlü görev desteği ve düşük bellek tüketimi arasındaki mükemmel dengeyi bulmak hiç bu kadar kolay olmamıştı.

Yorumlar