Link to this sectionPP-YOLOE+ ve RTDETRv2#

Bilgisayarlı görü alanı, özellikle gerçek zamanlı nesne tespiti dünyasında son yıllarda çarpıcı bir evrime tanıklık etti. Dağıtımın için doğru mimariyi seçmek, hantal ve bellek tüketen bir uygulama ile son derece optimize edilmiş, duyarlı bir sistem arasındaki fark anlamına gelebilir. Bu teknik karşılaştırmada, Baidu'nun iki önde gelen modelini inceliyoruz: CNN tabanlı PP-YOLOE+ ve transformer tabanlı RTDETRv2. Bunların mimarilerini, performans metriklerini ve ideal kullanım durumlarını analiz ederken, aynı zamanda son teknoloji Ultralytics YOLO26 platformuyla nasıl karşılaştırıldıklarını inceleyeceğiz.

Link to this sectionPP-YOLOE+: CNN Paradigmasını İlerletmek#

Öncüllerinin bir iterasyonu olarak geliştirilen PP-YOLOE+, geleneksel Evrişimli Sinir Ağlarının (CNN'ler) nesne tespitinde başarabileceklerinin sınırlarını zorluyor. YOLO serisinin temel mekanizmaları üzerine inşa edilen ve PaddlePaddle ekosistemi için özel optimizasyonlar sunan, oldukça yetenekli, çapasız (anchor-free) bir dedektördür.

Model Detayları:

Yazarlar: PaddlePaddle Yazarları
Kuruluş: Baidu
Tarih: 2022-04-02
Arxiv: 2203.16250
GitHub: PaddleDetection Deposu
Dokümanlar: PP-YOLOE+ Dokümantasyonu

Link to this sectionMimari ve Metodolojiler#

PP-YOLOE+, çok ölçekli özellikleri etkili bir şekilde birleştirmek için büyük ölçüde optimize edilmiş bir omurgaya (backbone) ve özelleştirilmiş bir özellik piramidi ağına dayanır. Genellikle çapa kutusu (anchor box) oluşturma için gereken sezgisel ayar sürecini basitleştiren çapasız bir tasarım kullanır. Ayrıca eğitim metodolojisi, öğrenme aşamasında tahminleri yerel gerçeklik (ground truth) kutularıyla daha iyi eşleştirmek için gelişmiş etiket atama stratejileri içerir.

Link to this sectionGüçlü Yönler ve Kullanım Durumları#

PP-YOLOE+'nın birincil gücü, standart sunucu donanımı üzerindeki sağlam performansı ve Baidu'nun araçlarıyla olan derin entegrasyonunda yatar. Donanım kısıtlamalarının aşırı derecede kısıtlayıcı olmadığı üretim ortamlarında statik kusur tespiti gibi geleneksel endüstriyel iş akışları için çok uygundur.

PP-YOLOE+ hakkında daha fazla bilgi edin

Ekosistem Değerlendirmeleri

PP-YOLOE+ yüksek doğruluk sunsa da, modern Ultralytics boru hatlarında kolayca kullanılabilen yerel dışa aktarma formatlarının aksine, onu kendi yerel ekosistemi dışında dağıtmak bazen ek dönüştürme adımları gerektirebilir.

Link to this sectionRTDETRv2: Gerçek Zamanlı Algılama Transformer'ları#

Saf CNN'lerden uzaklaşan RTDETRv2 (Gerçek Zamanlı Tespit Transformer'ı sürüm 2), bilgisayarlı görü görevleri için dikkat tabanlı mekanizmalara doğru bir sıçramayı temsil eder. Transformer'ların küresel bağlam anlayışını gerçek dünya uygulamaları için gereken düşük gecikme süresiyle birleştirmeye çalışır.

Model Detayları:

Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
Kurum: Baidu
Tarih: 24-07-2024
Arxiv: 2407.17140
GitHub: RT-DETRv2 Deposu
Dokümanlar: RTDETRv2 README

Link to this sectionMimari ve Metodolojiler#

RTDETRv2, özellik çıkarımı için bir CNN omurgasını, optimize edilmiş bir transformer kodlayıcı-kod çözücü ile birleştiren hibrit bir mimariden yararlanır. RTDETRv2'nin belirleyici bir özelliği, geleneksel NMS (Non-Maximum Suppression) sonrası işlemeyi atlayan yerel uçtan uca tasarımıdır. Ayrıca, uzak nesneler arasındaki mekansal ilişkileri anlamak için öz-dikkat (self-attention) kullanarak çok ölçekli tespit ve karmaşık sahne yönetimi gibi özellikler sunar.

Link to this sectionGüçlü Yönler ve Kullanım Durumları#

Transformer mimarisi, RTDETRv2'yi küresel bağlamı anlamanın çok önemli olduğu senaryolarda son derece etkili kılar. Bununla birlikte, transformer modelleri genellikle hafif CNN'lere kıyasla hem eğitim hem de çıkarım sırasında önemli ölçüde daha yüksek CUDA belleği talep eder. Güçlü GPU sunucularında çalışan bulut tabanlı video analitiği gibi kısıtlanmamış donanıma sahip ortamlar için en uygunudur.

RTDETR hakkında daha fazla bilgi edinin

Link to this sectionPerformans ve Metrik Karşılaştırması#

Bu modelleri değerlendirirken, ortalama Hassasiyet (mAP) ile hesaplama maliyeti (FLOP'lar ve çıkarım gecikmesi cinsinden ölçülen) arasındaki denge çok önemlidir. Aşağıdaki tablo, hem PP-YOLOE+ hem de RTDETRv2'nin çeşitli ölçekleri için temel metrikleri özetlemektedir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

RTDETRv2-s	640	48.1	-	5.03	20	60
RTDETRv2-m	640	51.9	-	7.51	36	100
RTDETRv2-l	640	53.4	-	9.76	42	136
RTDETRv2-x	640	54.3	-	15.03	76	259

RTDETRv2, daha yüksek parametre sayısı ve FLOP maliyetiyle güçlü bir mAP gösterse de, kısıtlı uç cihazlarda (edge devices) dağıtım yapmak isteyen geliştiriciler, transformer katmanlarının tipik olan ağır bellek gereksinimleri nedeniyle darboğazlarla karşılaşırlar.

Link to this sectionKullanım Durumları ve Öneriler#

PP-YOLOE+ ile RT-DETR arasında seçim yapmak; projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionPP-YOLOE+ Ne Zaman Seçilmeli#

PP-YOLOE+ şu durumlar için güçlü bir tercihtir:

PaddlePaddle Ekosistem Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip organizasyonlar.
Paddle Lite Uç Birim Dağıtımı: Özellikle Paddle Lite veya Paddle çıkarım motoru için optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım yapmak.
Yüksek Doğruluklu Sunucu Tarafı Algılama: Çerçeve bağımlılığının sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğunu önceliklendiren senaryolar.

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

RT-DETR şunlar için önerilir:

Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#

Hem PP-YOLOE+ hem de RTDETRv2 önemli kilometre taşlarını temsil etse de, modern geliştirici, aşırı performans ile akıcı kullanılabilirliği mükemmel bir şekilde dengeleyen bir ekosisteme ihtiyaç duyar. Ultralytics Platformu ve çığır açan YOLO26 modeli tam olarak bunu sunar.

Ocak 2026'da piyasaya sürülen YOLO26, uç (edge) öncelikli görüntüleme yapay zekası için yeni standardı belirliyor. Eski mimarilerle ilişkili dağıtım engellerini zarif bir şekilde çözerken, hız ve doğruluk açısından onları geride bırakıyor.

Link to this sectionMimari Yenilikler#

YOLO26, geleneksel CNN'leri ve ağır transformer'ları geride bırakan çeşitli öncü geliştirmeler sunar:

Uçtan Uca NMS'siz Tasarım: RTDETRv2 gibi, YOLO26 da yerel olarak uçtan ucadır. NMS (Non-Maximum Suppression) sonrası işlemeyi ortadan kaldırarak, gerçek zamanlı robotik ve otonom sistemler için ideal olan, azaltılmış gecikme dalgalanmasıyla daha hızlı ve daha basit dağıtım sağlar.
%43'e Kadar Daha Hızlı CPU Çıkarımı: Derin mimari optimizasyonlar sayesinde YOLO26, ayrı bir GPU'su olmayan uç cihazlarda rakip modellerden önemli ölçüde daha iyi performans gösterir ve bu da onu IoT ve akıllı şehir uygulamaları için birinci sınıf bir seçenek haline getirir.
MuSGD Optimize Edici: LLM eğitim yeniliklerinden esinlenen YOLO26, SGD ve Muon'un bir hibritini kullanır. Bu, daha kararlı eğitim yörüngeleri ve önemli ölçüde daha hızlı yakınsama sağlayarak GPU eğitim saatlerini ciddi oranda azaltır.
ProgLoss + STAL: Bu gelişmiş kayıp işlevleri, PP-YOLOE+ gibi modellerin geçmişte zorlandığı küçük nesne tanıma alanında dikkate değer iyileştirmeler sağlar ve hava görüntüleri ile drone uygulamaları için kritik öneme sahiptir.
DFL Kaldırma: Distribution Focal Loss'un kaldırılması, dışa aktarma sürecini basitleştirerek çeşitli uç ve düşük güçlü cihazlarda sorunsuz uyumluluk sağlar.

YOLO26 hakkında daha fazla bilgi edin

Göreve Özel Çok Yönlülük

Özelleşmiş nesne dedektörlerinin aksine, YOLO26 oldukça çok yönlüdür; Örnek Segmentasyonu, Poz Tahmini, Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) destekler. Pose için RLE ve OBB için özel açı kaybı gibi özel geliştirmeler içerir.

Link to this sectionBenzersiz Kullanım Kolaylığı#

RTDETRv2 gibi karmaşık mimarileri benimsemenin en büyük dezavantajlarından biri, dik öğrenme eğrisi ve kopuk entegrasyon süreçleridir. Ultralytics ekosistemi, bu karmaşıklıkları sezgisel bir Python API ve kapsamlı web tabanlı platform aracılığıyla tamamen soyutlar.

Özel veri kümeleri eğitiyor veya hızlı bir çıkarım çalıştırıyor olman fark etmeksizin, süreç sorunsuzdur:

from ultralytics import RTDETR, YOLO

# Initialize the state-of-the-art YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Alternatively, initialize an RT-DETR model via the same simple API
model_rtdetr = RTDETR("rtdetr-l.pt")

# Run real-time inference effortlessly
results = model_yolo("https://ultralytics.com/images/zidane.jpg")
results[0].show()

# Export for edge deployment in one line
model_yolo.export(format="engine", quantize=16)

Ultralytics YOLO modellerine özgü daha düşük bellek gereksinimleri, transformer tabanlı muadillerine kıyasla daha hızlı eğitebileceğin ve daha ucuz donanımlarda dağıtabileceğin anlamına gelir. Ayrıca, aktif geliştirme ve dünya standartlarındaki belgeler, üretim hatlarının kararlı kalmasını sağlar.

Alternatifleri araştıran ekipler için YOLO11, ekosistem içinde son derece desteklenen ve olağanüstü yetenekli bir öncül olarak kalmaya devam eder ve eski donanım entegrasyonları için mükemmel bir temel sağlar. YOLO11 vs RTDETR hakkındaki karşılaştırmamızı okumayı da faydalı bulabilirsin.

Link to this sectionÖzet#

PP-YOLOE+ ve RTDETRv2, bilgisayarlı görünün evrimine önemli katkılarda bulunarak sırasıyla gelişmiş CNN boru hatlarının ve gerçek zamanlı transformer'ların uygulanabilirliğini kanıtlamıştır. Bununla birlikte, 2026'da sağlam, çok yönlü ve yüksek düzeyde optimize edilmiş bilgisayarlı görü uygulamaları dağıtmak isteyen kuruluşlar için Ultralytics YOLO26 rakipsiz bir çözüm sunar. Yerel olarak NMS'siz mimarisi, önemli ölçüde daha hızlı CPU çıkarımı ve akıcı ekosistemi, geliştiricilerin fikirden ölçeklenebilir üretime her zamankinden daha hızlı geçmelerini sağlar.

Katkıda Bulunanlar

GLglenn-jocher¹⁵ ONonuralpszr¹

Oluşturulma 27 Oca 2025Güncellenme 3 hafta önce

Link to this sectionPP-YOLOE+ ve RTDETRv2#

Link to this sectionPP-YOLOE+: CNN Paradigmasını İlerletmek#

Link to this sectionMimari ve Metodolojiler#

Link to this sectionGüçlü Yönler ve Kullanım Durumları#

Link to this sectionRTDETRv2: Gerçek Zamanlı Algılama Transformer'ları#

Link to this sectionMimari ve Metodolojiler#

Link to this sectionGüçlü Yönler ve Kullanım Durumları#

Link to this sectionPerformans ve Metrik Karşılaştırması#

Link to this sectionKullanım Durumları ve Öneriler#

Link to this sectionPP-YOLOE+ Ne Zaman Seçilmeli#

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#

Link to this sectionMimari Yenilikler#

Link to this sectionBenzersiz Kullanım Kolaylığı#

Link to this sectionÖzet#

Yorumlar