PP-YOLOE+ ve RTDETRv2: Gerçek Zamanlı Nesne Algılama Mimarileri için Kapsamlı Bir Rehber

Bilgisayarlı görü alanı, son yıllarda, özellikle gerçek zamanlı nesne algılama dünyasında çarpıcı bir evrime tanık oldu. Dağıtımınız için doğru mimariyi seçmek, hantal ve bellek yoğunluklu bir uygulama ile yüksek düzeyde optimize edilmiş, duyarlı bir sistem arasındaki fark anlamına gelebilir. Bu teknik karşılaştırmada, Baidu'nun iki önde gelen modelini inceliyoruz: CNN tabanlı PP-YOLOE+ ve transformer tabanlı RTDETRv2. Mimarilerini, performans metriklerini ve ideal kullanım durumlarını analiz ederken, aynı zamanda en son teknoloji ürünü Ultralytics YOLO26 platformuyla nasıl kıyaslandıklarını da inceleyeceğiz.

PP-YOLOE+: CNN Paradigmasını İlerletmek

Seleflerinin bir yinelemesi olarak geliştirilen PP-YOLOE+, geleneksel Evrişimli Sinir Ağlarının (CNN'ler) nesne algılamada neler başarabileceğinin sınırlarını zorluyor. YOLO serisinin temel mekanizmaları üzerine inşa edilen ve PaddlePaddle ekosistemi için özel optimizasyonlar sunan, oldukça yetenekli, çapasız (anchor-free) bir dedektördür.

Model Detayları:

Mimari ve Metodolojiler

PP-YOLOE+, çok ölçekli özellikleri etkili bir şekilde toplamak için yoğun bir şekilde optimize edilmiş bir omurgaya (backbone) ve özelleştirilmiş bir özellik piramidi ağına güvenir. Genellikle çapa kutusu (anchor box) oluşturma için gereken sezgisel ayarlama sürecini basitleştiren çapasız bir tasarım kullanır. Ayrıca, eğitim metodolojisi, öğrenme aşamasında tahminleri yer gerçeği kutularıyla daha iyi eşleştirmek için gelişmiş etiket atama stratejileri içerir.

Güçlü Yönler ve Kullanım Durumları

PP-YOLOE+'nın birincil gücü, standart sunucu donanımı üzerindeki güçlü performansı ve Baidu'nun araçlarıyla olan derin entegrasyonunda yatar. Donanım kısıtlamalarının aşırı derecede kısıtlayıcı olmadığı üretim ortamlarında, statik kusur tespiti gibi geleneksel endüstriyel iş akışları için çok uygundur.

PP-YOLOE+ hakkında daha fazla bilgi edin

Ekosistem Hususları

PP-YOLOE+ yüksek doğruluk sunsa da, onu yerel ekosisteminin dışında dağıtmak, modern Ultralytics boru hatlarında kolayca bulunabilen yerel dışa aktarma formatlarının aksine, bazen ek dönüştürme adımları gerektirebilir.

RTDETRv2: Gerçek Zamanlı Algılama Transformer'ları

Saf CNN'lerden uzaklaşan RTDETRv2 (Gerçek Zamanlı Algılama Transformer'ı sürüm 2), bilgisayarlı görü görevleri için dikkat tabanlı mekanizmalara doğru bir sıçramayı temsil eder. Transformer'ların küresel bağlam anlama yeteneğini, gerçek dünya uygulamaları için gereken düşük gecikme süresiyle birleştirmeye çalışır.

Model Detayları:

Mimari ve Metodolojiler

RTDETRv2, özellik çıkarımı için bir CNN omurgasını, akıcı bir transformer kodlayıcı-kod çözücü ile birleştiren hibrit bir mimariden yararlanır. RTDETRv2'nin belirleyici bir özelliği, geleneksel NMS (Non-Maximum Suppression) son işleme sürecini atlayan yerel uçtan uca tasarımıdır. Ayrıca, uzak nesneler arasındaki uzamsal ilişkileri anlamak için öz-dikkat (self-attention) kullanarak çok ölçekli algılama ve karmaşık sahne yönetimi gibi özellikler sunar.

Güçlü Yönler ve Kullanım Durumları

Transformer mimarisi, RTDETRv2'yi küresel bağlamı anlamanın kritik olduğu senaryolarda oldukça etkili kılar. Ancak, transformer modelleri tipik olarak hafif CNN'lere kıyasla hem eğitim hem de çıkarım sırasında önemli ölçüde daha yüksek CUDA belleği talep eder. Güçlü GPU sunucularında çalışan bulut tabanlı video analitiği gibi kısıtlanmamış donanıma sahip ortamlar için en uygunudur.

RTDETR hakkında daha fazla bilgi edin

Performans ve Metrik Karşılaştırması

Bu modelleri değerlendirirken, mAP (ortalama Hassasiyet) ile hesaplama maliyeti (FLOP'lar ve çıkarım gecikmesi ile ölçülür) arasındaki ödünleşim çok önemlidir. Aşağıdaki tablo, hem PP-YOLOE+ hem de RTDETRv2'nin çeşitli ölçekleri için temel metrikleri özetlemektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

RTDETRv2, daha yüksek parametre sayıları ve FLOP'lar pahasına güçlü mAP gösterse de, kısıtlı uç cihazlarda (edge devices) dağıtım yapmak isteyen geliştiriciler, transformer katmanlarının tipik ağır bellek gereksinimleri nedeniyle genellikle darboğazlarla karşılaşırlar.

Kullanım Durumları ve Öneriler

PP-YOLOE+ ile RT-DETR arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

PP-YOLOE+ Ne Zaman Seçilmeli

PP-YOLOE+ şunlar için güçlü bir tercihtir:

  • PaddlePaddle Ekosistemi Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip kuruluşlar.
  • Paddle Lite Uç Dağıtımı: Paddle Lite veya Paddle çıkarım motoru için özel olarak optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım yaparken.
  • Yüksek Doğruluklu Sunucu Tarafı Algılama: Çerçeve bağımlılığının bir sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğuna öncelik veren senaryolar.

Ne Zaman RT-DETR Seçilmeli?

RT-DETR şunlar için önerilir:

  • Transformer Tabanlı Algılama Araştırmaları: NMS gerektirmeyen uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini araştıran projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük ölçekli nesnelerin bulunduğu sahneler.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics Avantajı: YOLO26 ile Tanışın

PP-YOLOE+ ve RTDETRv2 önemli kilometre taşlarını temsil etse de, modern geliştirici aşırı performansı akıcı kullanılabilirlikle mükemmel bir şekilde dengeleyen bir ekosisteme ihtiyaç duyar. Ultralytics Platform ve çığır açan YOLO26 modeli tam olarak bunu sunar.

Ocak 2026'da piyasaya sürülen YOLO26, uç tabanlı (edge-first) görü yapay zekası için yeni standardı belirler. Daha eski mimarilerle ilişkili dağıtım engellerini zarif bir şekilde çözerken, hız ve doğruluk açısından onları geride bırakır.

Mimari Yenilikler

YOLO26, geleneksel CNN'leri ve ağır transformer'ları geride bırakan birkaç öncü geliştirme sunar:

  • Uçtan Uca NMS-Siz Tasarım: RTDETRv2 gibi, YOLO26 da yerel olarak uçtan ucadır. NMS (Non-Maximum Suppression) son işleme sürecini ortadan kaldırarak, gerçek zamanlı robotik ve otonom sistemler için ideal olan, azaltılmış gecikme titremesiyle daha hızlı, daha basit bir dağıtım sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Derin mimari optimizasyonlar sayesinde YOLO26, ayrı GPU'lardan yoksun uç cihazlarda rakip modellerden önemli ölçüde daha iyi performans gösterir ve bu da onu IoT ve akıllı şehir uygulamaları için birinci sınıf bir seçim haline getirir.
  • MuSGD Optimize Edici: LLM eğitim yeniliklerinden esinlenen YOLO26, SGD ve Muon'un bir hibritini kullanır. Bu, daha kararlı eğitim yörüngeleri ve belirgin şekilde daha hızlı yakınsama sağlayarak GPU eğitim saatlerini büyük ölçüde azaltır.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada kayda değer iyileştirmeler sağlar; bu, PP-YOLOE+ gibi modellerin geçmişte zorlandığı bir alandır ve hava görüntüleri ve drone uygulamaları için kritik öneme sahiptir.
  • DFL Kaldırma: Dağılım Odaklı Kaybın (Distribution Focal Loss) kaldırılması, dışa aktarma sürecini basitleştirir ve çeşitli uç ve düşük güçlü cihazlarda sorunsuz uyumluluk sağlar.

YOLO26 hakkında daha fazla bilgi edin

Göreve Özel Çok Yönlülük

Özel nesne dedektörlerinin aksine YOLO26, Örnek Segmentasyonu, Poz Tahmini, Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) destekleyerek oldukça çok yönlüdür. Poz için RLE ve OBB için özel açı kaybı gibi özel geliştirmeler içerir.

Eşsiz Kullanım Kolaylığı

RTDETRv2 gibi karmaşık mimarileri benimsemenin en büyük dezavantajlarından biri, dik öğrenme eğrisi ve kopuk entegrasyon süreçleridir. Ultralytics ekosistemi, sezgisel bir Python API'si ve kapsamlı web tabanlı platform aracılığıyla bu karmaşıklıkları tamamen soyutlar.

İster özel veri setleri eğitiyor olun, ister hızlı bir çıkarım çalıştırıyor olun, süreç sorunsuzdur:

from ultralytics import RTDETR, YOLO

# Initialize the state-of-the-art YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Alternatively, initialize an RT-DETR model via the same simple API
model_rtdetr = RTDETR("rtdetr-l.pt")

# Run real-time inference effortlessly
results = model_yolo("https://ultralytics.com/images/zidane.jpg")
results[0].show()

# Export for edge deployment in one line
model_yolo.export(format="engine", half=True)

Ultralytics YOLO modellerine özgü daha düşük bellek gereksinimleri, transformer tabanlı muadillerine kıyasla daha hızlı eğitebileceğin ve daha ucuz donanımlarda dağıtım yapabileceğin anlamına gelir. Ayrıca, aktif geliştirme ve birinci sınıf dokümantasyon, üretim hatlarının kararlı kalmasını sağlar.

Alternatifleri araştıran ekipler için YOLO11, ekosistem içinde oldukça desteklenen ve son derece yetenekli bir selef olmaya devam ederek eski donanım entegrasyonları için mükemmel bir temel sağlar. YOLO11 vs RTDETR karşılaştırmamızı okumayı da faydalı bulabilirsin.

Özet

PP-YOLOE+ ve RTDETRv2, sırasıyla gelişmiş CNN boru hatlarının ve gerçek zamanlı transformer'ların uygulanabilirliğini kanıtlayarak bilgisayarlı görünün evrimine önemli katkılarda bulunmuştur. Ancak, 2026'da sağlam, çok yönlü ve yüksek düzeyde optimize edilmiş bilgisayarlı görü uygulamaları dağıtmak isteyen kuruluşlar için Ultralytics YOLO26 rakipsiz bir çözüm sunar. Yerel olarak NMS'siz mimarisi, önemli ölçüde daha hızlı CPU çıkarımı ve akıcı ekosistemi, geliştiricilerin fikir aşamasından ölçeklenebilir üretime her zamankinden daha hızlı geçmelerini sağlar.

Yorumlar