YOLOv8 ve RTDETRv2: Derinlemesine Teknik Bir Karşılaştırma

Bilgisayarlı görü dünyası sürekli gelişiyor ve yeni mimariler, gerçek zamanlı nesne algılamada mümkün olanın sınırlarını zorluyor. Çok dikkat çeken iki önemli model Ultralytics YOLOv8 ve Baidu'nun RTDETRv2 modelidir. Bu kılavuz, bu iki güçlü model arasında mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını inceleyen kapsamlı bir teknik karşılaştırma sunmaktadır.

YOLOv8 Genel Bakış

Ultralytics YOLOv8, YOLO (You Only Look Once) model ailesinde önemli bir kilometre taşını temsil eder. Çok çeşitli görevler için olağanüstü hız, doğruluk ve kullanım kolaylığı sağlamak adına yılların temel araştırmalarının üzerine inşa edilmiştir.

Temel Özellikler:

Mimari ve Güçlü Yönler

YOLOv8, hem özellik çıkarma hem de sınırlayıcı kutu (bounding box) regresyonunu optimize eden modern bir mimari sunar. Tahmin başlığını basitleştiren ve eğitim sırasında gereken hiperparametre ayarlarının sayısını azaltan çapasız (anchor-free) bir dedektördür. Bu mimari, çıkarım hızı ve ortalama hassasiyet (mAP) arasında harika bir performans dengesi sağlayarak hem uç cihazlarda hem de bulut sunucularında gerçek dünya dağıtımı için son derece uygun hale gelir.

Ayrıca YOLOv8, transformer tabanlı mimarilere kıyasla eğitim sırasında önemli ölçüde daha düşük bellek gereksinimlerine sahiptir. Bu, geliştiricilerin bellek yetersizliği hatalarıyla karşılaşmadan standart tüketici GPU'larında modelleri eğitmelerine olanak tanır.

Çok yönlülük

YOLOv8'in belirleyici güçlerinden biri, doğal çok yönlülüğüdür. Birçok model yalnızca sınırlayıcı kutulara odaklansa da, YOLOv8 nesne algılama, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama için kutudan çıktığı gibi destek sunar.

YOLOv8 hakkında daha fazla bilgi edin

RTDETRv2 Genel Bakış

RTDETRv2 (Real-Time Detection Transformer version 2), orijinal RT-DETR üzerine inşa edilmiştir ve Vision Transformer'ların güçlü dikkat mekanizmalarını gerçek zamanlı nesne algılama uygulamalarına getirmeyi amaçlar.

Temel Özellikler:

Mimari ve Güçlü Yönler

RTDETRv2, Evrişimli Sinir Ağı (CNN) omurgasını transformer kodlayıcı-kod çözücü yapısıyla birleştiren hibrit bir mimariden yararlanır. Bu, modelin öz-dikkat mekanizmaları aracılığıyla karmaşık uzamsal ilişkileri ve küresel bağlamı yakalamasını sağlar. "Bag-of-freebies" eğitim stratejileri setini kullanarak RTDETRv2, COCO veri seti gibi standart kıyaslama veri setlerinde rekabetçi mAP skorları elde eder.

Zayıf Yönler

Yüksek doğruluğuna rağmen RTDETRv2'nin transformer tabanlı yapısı, saf CNN mimarilerine kıyasla daha yüksek bellek tüketimi ve daha yavaş eğitim süreleri getirir. Transformer'lar doğası gereği daha fazla VRAM gerektirir, bu da onları kaynakları kısıtlı donanımlarda eğitmeyi zorlaştırır. Ek olarak, RTDETRv2 algılamada güçlü olsa da, Ultralytics ekosistemine özgü çok görevli çok yönlülükten (poz ve segmentasyon gibi) yoksundur.

RTDETRv2 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Modelleri üretim için değerlendirirken, model boyutu, çıkarım hızı ve doğruluk arasındaki denge çok önemlidir. Aşağıdaki tablo, YOLOv8 ve RTDETRv2 varyantlarının doğrudan bir karşılaştırmasını sunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
Donanım ve Metrikler

Hızlar, bir Amazon EC2 P4d örneği kullanılarak ölçülmüştür. CPU çıkarımı ONNX kullanırken, GPU hızları TensorRT ile test edilmiştir.

Kullanım Durumları ve Öneriler

YOLOv8 ile RT-DETR arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

YOLOv8 Ne Zaman Seçilmeli

YOLOv8 şunlar için güçlü bir seçenektir:

  • Çok Yönlü Çoklu Görev Dağıtımı: Ultralytics ekosistemi içinde tespit, segmentasyon, sınıflandırma ve poz tahmini için kanıtlanmış bir model gerektiren projeler.
  • Kurulmuş Üretim Sistemleri: Halihazırda YOLOv8 mimarisi üzerine kurulu, kararlı ve iyi test edilmiş dağıtım süreçlerine sahip mevcut üretim ortamları.
  • Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından yararlanan uygulamalar.

Ne Zaman RT-DETR Seçilmeli?

RT-DETR şunlar için önerilir:

  • Transformer Tabanlı Algılama Araştırmaları: NMS gerektirmeyen uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini araştıran projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük ölçekli nesnelerin bulunduğu sahneler.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics Avantajı

Bir model seçmek ham metriklerin ötesine geçer; çevresindeki yazılım ekosistemi, geliştirici üretkenliği için çok önemlidir. Ultralytics ekosistemi, tüm makine öğrenimi yaşam döngüsünü basitleştiren birleşik bir Python API'si sağlayarak kullanım kolaylığı ile tanınır.

Veri seti yönetiminden dağıtık eğitime kadar Ultralytics, karmaşık kod kalıplarını soyutlar. Geliştiriciler, hazır eğitilmiş ağırlıklardan ve Hugging Face gibi platformlarla ve izleme araçlarıyla sorunsuz entegrasyondan yararlanır. Bu iyi korunan ekosistem, aktif geliştirmeyi, sık güncellemeleri ve güçlü topluluk desteğini garanti eder.

Ayrıca eğitim verimliliği, Ultralytics YOLO modellerinin bir imzasıdır. Eğitim süreci sırasında hızlı yakınsama ve daha düşük bellek ayak izi için oldukça optimize edilmişlerdir; bu da RTDETRv2 gibi transformer tabanlı dedektörlere kıyasla deney döngülerini önemli ölçüde hızlandırır.

Geleceğe Bakış: YOLO26'nın Gücü

YOLOv8 güçlü bir model olmaya devam etse de, mutlak en son teknolojiyi arayan geliştiriciler, Ocak 2026'da piyasaya sürülen ve merakla beklenen YOLO26 sürümüne geçmeyi düşünmelidir. YOLO26, birkaç çığır açan yenilikle güncel teknolojiyi yeniden tanımlıyor:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression (NMS) sonrası işlemini ortadan kaldırarak daha hızlı ve daha deterministik dağıtım iş akışları sağlar.
  • DFL Kaldırılması: Distribution Focal Loss'un kaldırılması, modeli gelişmiş uç ve düşük güç tüketen cihaz uyumluluğu için modernize eder.
  • MuSGD Optimize Edici: LLM eğitimindeki yenilikleri entegre eden MuSGD optimize edici, daha kararlı eğitim süreçleri ve daha hızlı yakınsama sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Özel GPU'lara sahip olmayan ortamlar için yoğun şekilde optimize edilmiştir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntüleri ve robotik için kritik olan küçük nesne tanımada kayda değer iyileştirmeler sağlar.

Ultralytics paketi içinde keşfedilmeye değer diğer modern alternatifler arasında, eski projeler için sağlam performans sunan YOLO11 bulunur; ancak tüm yeni dağıtımlar için YOLO26 önerilir.

Kod Örneği: Eğitim ve Çıkarım

Ultralytics API'sinin basitliği, modelleri sadece birkaç satır Python koduyla yükleyebileceğin, eğitebileceğin ve dağıtabileceğin anlamına gelir. Aşağıdaki örneği çalıştırmadan önce PyTorch kurulu olduğundan emin ol.

from ultralytics import YOLO

# Load a pretrained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model on your custom dataset
# Memory efficient training allows for larger batch sizes
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

# Export seamlessly for edge deployment
export_path = model.export(format="onnx")
Dağıtıma Hazır

Ultralytics, ONNX, TensorRT ve CoreML dahil olmak üzere çok sayıda formata tek tıkla dışa aktarmayı destekleyerek farklı donanım mimarileri arasında model dağıtım seçeneklerini basitleştirir.

Sonuç

Hem YOLOv8 hem de RTDETRv2, gerçek zamanlı nesne algılama için etkileyici yetenekler sunar. RTDETRv2, transformer'ların küresel bağlamı yakalamadaki gücünü gösterir ve bu da onu, çıkarım hızı ve bellek yükünün birincil kısıtlamalar olmadığı karmaşık uzamsal akıl yürütme görevleri için uygun hale getirir.

Bununla birlikte, hız, doğruluk ve kaynak verimliliğinin olağanüstü dengesine öncelik veren geliştiriciler için Ultralytics YOLO modelleri üstün seçenek olmaya devam etmektedir. YOLOv8'in hafif yapısı, benzersiz kullanım kolaylığı, birden fazla görme görevindeki çok yönlülüğü ve gelişen açık kaynak ekosistemi ile birleştiğinde, onu ölçeklenebilir üretim ortamları için gidilecek çözüm haline getirir. Uç performansın zirvesini arayanlar için, yeni piyasaya sürülen YOLO26, sektöre liderlik etmeye devam eden rakipsiz, NMS-free bir verimlilik sunar.

Yorumlar