Link to this sectionRTDETRv2 ile YOLOv8 karşılaştırması#
Bilgisayarlı görü dünyası sürekli değişiyor; bu değişim genellikle geleneksel Evrişimli Sinir Ağları (CNN'ler) ile yeni Transformer tabanlı mimariler arasındaki devam eden rekabetle öne çıkıyor. Bu kapsamlı teknik karşılaştırmada, önde gelen bir vision transformer olan RTDETRv2'nin, sektörde en yaygın benimsenen ve çok yönlü CNN modellerinden biri olan Ultralytics YOLOv8 karşısında nasıl bir performans sergilediğini inceliyoruz. Her iki model de mühendisler ve araştırmacılar için güçlü yetenekler sunuyor, ancak temel mimarileri; eğitim metodolojileri, dağıtım kısıtlamaları ve genel performans açısından belirgin farklar doğuruyor.
Link to this sectionModel Genel Bakışı: RTDETRv2#
RTDETRv2 (Gerçek Zamanlı Algılama Transformer'ı sürüm 2), vision transformer mimarisini gerçek zamanlı çıkarım hızları için optimize ederek selefinin temel başarısının üzerine inşa edilmiştir.
Temel Teknik Detaylar:
- Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
- Organizasyon: Baidu
- Tarih: 2024-07-24
- Bağlantılar: ArXiv Yayını | GitHub Deposu
Link to this sectionMimari ve Güçlü Yönler#
RTDETRv2 özünde, bir CNN omurgasını transformer kodlayıcı-kod çözücü yapısıyla birleştiren hibrit bir mimariden yararlanır. Bu, modelin tüm görüntüyü bağlamsal olarak görmesini sağlayarak, örtüşen nesnelerin bulunduğu karmaşık sahneleri yönetmede olağanüstü derecede usta olmasını sağlar. En belirgin özelliklerinden biri, NMS (Non-Maximum Suppression) son işleme adımını tamamen devre dışı bırakan yerel uçtan uca tasarımıdır. Bu, algılama hattının son aşamalarında algoritmik karmaşıklığı azaltır. Ayrıca, çok ölçekli algılama yetenekleri, hem devasa yapıları hem de küçük arka plan öğelerini etkili bir şekilde tanımlamasına olanak tanır.
Link to this sectionZayıf Yönler#
Güçlü bağlamsal anlayışına rağmen, RTDETRv2 gibi transformer tabanlı mimariler eğitim sırasında muazzam bir hesaplama yükü gerektirir. Önemli miktarda CUDA belleğine ihtiyaç duyarlar, bu da onları tüketici sınıfı donanımlarda eğitmeyi zorlaştırır. Ayrıca, özel bir veri kümesi kurmak ve eğitim hiperparametrelerini ayarlamak genellikle derin alan uzmanlığı gerektirir, çünkü model oldukça cilalı, başlangıç seviyesine uygun bir yazılım sarmalayıcısından yoksundur. Daha eski Raspberry Pi donanımı gibi düşük güçlü uç cihazlara dağıtım yapmak da ağır dikkat (attention) mekanizmaları nedeniyle zorlayıcı olabilir.
RTDETRv2 hakkında daha fazla bilgi edin
Link to this sectionModel Genel Bakışı: YOLOv8#
Ultralytics YOLOv8, piyasaya sürülmesinden bu yana üretim seviyesindeki bilgisayarlı görü görevleri için bir endüstri standardı haline gelmiş, üst düzey doğruluğun yanı sıra kusursuz bir geliştirici deneyimine öncelik vermiştir.
Temel Teknik Detaylar:
- Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 10 Ocak 2023
- Bağlantılar: Resmi Dokümantasyon | GitHub Deposu
Link to this sectionMimari ve Güçlü Yönler#
YOLOv8, önceki nesillere göre nesne konumlandırma ve sınıflandırma doğruluğunu önemli ölçüde artıran, ayrıştırılmış kafaya sahip, oldukça optimize edilmiş, çapa gerektirmeyen (anchor-free) bir CNN mimarisi kullanır. En büyük gücü, inanılmaz verimliliği ve çok yönlülüğüdür. Mimari, eğitim sırasında vision transformer'lara kıyasla önemli ölçüde daha az bellek gerektirir, bu da uygulayıcıların standart GPU'larda daha büyük batch boyutu kullanmasına olanak tanır. Ayrıca, Ultralytics ekosistemi benzersiz, kesintisiz bir iş akışı sunar. Birleşik Python API'si; hiperparametre ayarlama, eğitim, doğrulama ve dışa aktarma işlemlerini sadece birkaç satır kodla yapmanı sağlar.
Link to this sectionZayıf Yönler#
YOLOv8, son işleme aşamasında geleneksel NMS'ye güvenir. Ultralytics motoru bunu arka planda verimli bir şekilde halletse de, yerel olarak NMS gerektirmeyen mimarilere kıyasla teknik olarak küçük bir son işleme gecikmesi ortaya çıkarır.
YOLOv8 hakkında daha fazla bilgi edinin
Link to this sectionPerformans ve Metrik Karşılaştırması#
Ham sayıları karşılaştırdığımızda, her iki modelin de dağıtım hattının farklı yönlerine öncelik verdiği açıkça görülmektedir. Aşağıda yan yana bir performans analizi yer almaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
| RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
| RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
| RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
RTDETRv2-x, YOLOv8x'in 53.9'luk mAP değerine kıyasla 54.3 ile marjinal olarak daha yüksek bir tepe mAP değerine ulaşsa da, YOLOv8 serisi çıkarım hızı ve parametre verimliliğinde baskındır. Örneğin, YOLOv8s bir TensorRT motorunda RTDETRv2-s'ye kıyasla neredeyse iki kat daha hızlı çalışırken, parametrelerin neredeyse yarısını gerektirir.
Link to this sectionBellek Gereksinimleri ve Eğitim Verimliliği#
Bağımsız geliştiriciler ve kurumsal ekipler için en kritik faktörlerden biri eğitim maliyetidir. Ultralytics YOLO modelleri, eğitim süreci sırasında transformer mimarilerinden önemli ölçüde daha düşük CUDA belleği gerektirir. Standart bir RTDETRv2 modeli tüketici sınıfı bir GPU'yu kolayca darboğaza sokabilirken, YOLOv8, NVIDIA RTX 4070 gibi donanımlarda hızlı ve güvenilir bir şekilde yakınsar.
Link to this sectionEkosistem, API ve Kullanım Kolaylığı#
Modern yapay zeka çözümleri için gerçek ayırt edici faktör, destekleyici yazılım çerçevesidir. Ultralytics ekosistemi karmaşık mühendislik engellerini basitleştirir. Discord gibi platformlardaki aktif geliştirme ve güçlü topluluk desteği ile YOLOv8, projenin yetersiz dokümantasyon nedeniyle duraksamamasını sağlar.
Dahası, YOLOv8 standart nesne algılamanın ötesine geçer. Örnek Bölütleme (Instance Segmentation), Poz Tahmini (Pose Estimation), Görüntü Sınıflandırma (Image Classification) ve Yönelimli Sınırlayıcı Kutular (OBB) için yerel desteğe sahip gerçek bir çok görevli (multi-task) ağdır. RTDETRv2 ise tamamen algılamaya odaklanmış durumdadır.
Link to this sectionKod Örneği: Birleşik Sadelik#
Ultralytics Python API'sini kullanarak, her iki model ailesiyle de birleşik bir ortamda sorunsuzca deney yapabilirsin.
from ultralytics import RTDETR, YOLO
# Load an RT-DETR model and a YOLOv8 model seamlessly
model_transformer = RTDETR("rtdetr-l.pt")
model_cnn = YOLO("yolov8l.pt")
# Predict on a sample image using the exact same API
results_transformer = model_transformer("https://ultralytics.com/images/bus.jpg")
results_cnn = model_cnn("https://ultralytics.com/images/bus.jpg")
# Export YOLOv8 to ONNX for rapid edge deployment
model_cnn.export(format="onnx")Eğitildikten sonra YOLOv8, çeşitli donanım arka uçlarında yüksek verimli çıkarımı garanti eden ONNX, TensorRT ve OpenVINO formatlarına tek tıkla dışa aktarmayı destekler.
Link to this sectionKullanım Durumları ve Öneriler#
RT-DETR ile YOLOv8 arasında seçim yapmak, projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionRT-DETR Ne Zaman Seçilmeli#
RT-DETR şunlar için güçlü bir seçimdir:
- Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
- Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
- Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.
Link to this sectionYOLOv8 Ne Zaman Seçilmeli#
YOLOv8 şunlar için önerilir:
- Çok Yönlü Çoklu Görev Dağıtımı: Ultralytics ekosistemi içinde algılama, segmentasyon, sınıflandırma ve poz tahmini için kanıtlanmış bir modele ihtiyaç duyan projeler.
- Yerleşik Üretim Sistemleri: Halihazırda YOLOv8 mimarisi üzerine kurulu, istikrarlı ve iyi test edilmiş dağıtım hatlarına sahip mevcut üretim ortamları.
- Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından yararlanan uygulamalar.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionİleriye Bakış: YOLO26 Avantajı#
YOLOv8 efsanevi bir dönüm noktası olarak kalsa da, bilgisayarlı görü inanılmaz hızlı ilerliyor. 2026'da kesinlikle en son teknolojiyi arayan ekipler için Ultralytics YOLO26 bir sonraki paradigma değişimini temsil ediyor.
Eğer RTDETRv2'nin NMS içermeyen tasarımına ilgi duyuyorsan, YOLO26 yerel bir Uçtan Uca NMS'siz Tasarım içermekte olup, transformer'ların son işleme sadeliğini CNN'lerin baş döndürücü hızıyla birleştirir. Ayrıca, YOLO26 çığır açan MuSGD Optimizer kullanır ve vision modellerine LLM tarzı eğitim kararlılığı getirerek inanılmaz hızlı yakınsama sağlar. DFL Kaldırma (basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güç cihaz uyumluluğu için Dağılımsal Odak Kaybı kaldırılmıştır) ile YOLO26, %43'e kadar daha hızlı CPU çıkarımı elde eder. Üstün küçük nesne algılama için gelişmiş ProgLoss + STAL mekanizmalarıyla birleştiğinde, YOLO26 hem YOLOv8 hem de RTDETRv2'ye göre kesinlikle önerilen yükseltme yoludur.
Alternatif modeller hakkında daha fazla okuma yapmak için YOLO11 kılavuzlarımızı keşfet veya YOLO ailesinde NMS'siz mimarinin nasıl evrimleştiğini görmek için YOLOv10 ile YOLOv8 karşılaştırması hakkındaki detaylı analizi oku.