PP-YOLOE+ ve YOLOv5: Gerçek Zamanlı Nesne Algılamanın Teknik Karşılaştırması

Bilgisayar görüşünün rekabetçi ortamında, doğru nesne algılama mimarisini seçmek geliştiriciler ve araştırmacılar için kritik bir karardır. Baidu'nun PaddlePaddle ekibi tarafından geliştirilen PP-YOLOE+ ve Ultralytics tarafından oluşturulan YOLOv5, gerçek zamanlı algılama zorluklarını çözmek için iki farklı yaklaşım olarak öne çıkmaktadır. PP-YOLOE+, PaddlePaddle ekosistemi içinde anchor-free mekanizmalarını vurgularken, YOLOv5 PyTorch içinde kullanılabilirlik, dağıtım esnekliği ve topluluk desteği için endüstri standardını belirlemiştir.

Bu kılavuz, bu iki etkili modelin mimarilerini, performans metriklerini ve üretim otomasyonu ve kenar bilişim gibi gerçek dünya uygulamaları için uygunluklarını karşılaştıran derinlemesine bir teknik analiz sunar.

Modele Genel Bakış

PP-YOLOE+

PP-YOLOE+, eğitim yakınsamasını ve sonraki görev performansını iyileştirmek için tasarlanmış bir PP-YOLOE evrimidir. PaddlePaddle çerçevesinde çalışır ve algılama başlığını basitleştirmek için anchor-free bir paradigmayı kullanır. Daha güçlü bir backbone ve rafine edilmiş eğitim stratejileri dahil ederek, bulut tabanlı çıkarımın yaygın olduğu endüstriyel uygulamalar için yüksek hassasiyet sunmayı hedefler.

Yazarlar: PaddlePaddle Yazarları
Kuruluş:Baidu
Tarih: 2022-04-02
Arxiv:2203.16250
GitHub:PaddleDetection Deposu

Ultralytics YOLOv5

YOLOv5, nesne algılamada kullanıcı deneyiminde devrim yarattı. Ultralytics tarafından piyasaya sürülen bu model, "önce dağıtım" mühendisliğini önceliklendirerek modellerin yalnızca doğru olmakla kalmayıp aynı zamanda çeşitli donanımlarda eğitilmesinin, dışa aktarılmasının ve çalıştırılmasının inanılmaz derecede kolay olmasını sağlar. Çapa tabanlı mimarisi hız için yüksek düzeyde optimize edilmiştir ve bu da onu uç cihazlarda gerçek zamanlı çıkarım için favori haline getirir.

Yazar: Glenn Jocher
Kuruluş:Ultralytics
Tarih: 2020-06-26
GitHub:Ultralytics YOLOv5

YOLOv5 hakkında daha fazla bilgi edinin.

Teknik Mimari Karşılaştırması

PP-YOLOE+ ve YOLOv5'in mimari felsefeleri önemli ölçüde farklılık göstererek eğitim davranışlarını ve dağıtım özelliklerini etkiler.

Backbone ve Özellik Çıkarımı

YOLOv5, bir CSPDarknet (Çapraz Aşama Kısmi Ağ) backbone kullanır. Bu tasarım, gradyan akışını iyileştirir ve performanstan ödün vermeden parametre sayısını azaltır. Mimari, farklı model derinlikleri ve genişlikleriyle (Nano'dan X-Large'a) hızlı deneyler yapılmasına olanak tanıyan son derece modülerdir. Bu modülerlik, Raspberry Pi veya mobil cihazlar gibi kaynak kısıtlı ortamlara dağıtım yapan geliştiriciler için anahtardır.

PP-YOLOE+ ise tipik olarak, artık bağlantıları yeniden parametrelendirme teknikleriyle birleştiren bir CSPRepResStage backbone kullanır. Zengin özellikler çıkarmak için etkili olsa da, bu yapı genellikle eğitim aşamasında YOLOv5'in uygulamasının kolaylaştırılmış verimliliğine kıyasla daha yüksek karmaşıklığa neden olur.

Algılama Başlıkları: Anchor-Based ve Anchor-Free

Temel bir fark algılama başlıklarında yatmaktadır:

YOLOv5 (Çapa Tabanlı): Nesne konumlarını tahmin etmek için önceden tanımlanmış çapa kutuları kullanır. Bu, başlangıç yapılandırması gerektirse de (Ultralytics bunu AutoAnchor aracılığıyla otomatikleştirir), kararlı eğitim gradyanları ve COCO gibi standart veri kümelerinde tarihsel olarak sağlam performans sağlar.
PP-YOLOE+ (Çapasız): Nesne merkezlerini ve boyutlarını doğrudan tahmin ederek çapa kutusu hiperparametre ayarı ihtiyacını ortadan kaldırır. Bu yaklaşım, aşırı en boy oranlarına sahip nesneleri iyi işler ancak eğitim verilerinin kalitesine ve başlangıç kaybı yakınsamasına karşı daha hassas olabilir.

Çapasız Tasarıma Geçiş

YOLOv5 başarıyla çapa kullanırken, YOLOv8 ve son teknoloji YOLO26 gibi daha yeni Ultralytics modelleri, kullanım kolaylığı ve üstün geometrik genellemeyi birleştiren çapasız tasarımlara geçiş yaptı.

Performans Metrikleri

Performansı değerlendirirken, ortalama Ortalama Hassasiyet (mAP) ve gecikme arasındaki ödünleşime bakmak çok önemlidir. Aşağıdaki tablo, PP-YOLOE+'nın yüksek doğruluk elde ederken, YOLOv5'in CPU hızında ve dağıtım çok yönlülüğünde rekabetçi bir üstünlük sağladığını ve yeni kullanıcılar için önemli ölçüde daha düşük giriş engelleri sunduğunu vurgulamaktadır.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Hız ve Verimlilik Analizi

Ultralytics YOLOv5, özellikle "Nano" ve "Small" varyantlarında olağanüstü verimlilik sergiler. Yalnızca 1.9M parametreye sahip YOLOv5n modeli, mobil uygulamalar veya IoT sensörleri gibi son derece kısıtlı ortamlar için özel olarak tasarlanmıştır. PP-YOLOE+ güçlü mAP değerleri sunsa da, kurulum karmaşıklığı ve PaddlePaddle çerçevesine bağımlılık, standart PyTorch veya ONNX iş akışlarına dayanan üretim hatlarında sürtünmeye neden olabilir.

Ayrıca, Bellek Gereksinimleri YOLOv5'i destekler. Eğitim sırasında, YOLOv5'in optimize edilmiş veri yükleyicileri ve bellek yönetimi, birçok rakibe kıyasla tüketici sınıfı GPU'larda daha büyük toplu iş boyutlarına olanak tanıyarak yapay zeka mühendisleri için donanım engelini azaltır.

Eğitim ve Ekosistem

Bir modeli çevreleyen ekosistem, genellikle modelin kendisi kadar önemlidir. Ultralytics'in belirgin bir avantaj sağladığı nokta burasıdır.

Kullanım Kolaylığı ve Dokümantasyon

YOLOv5, "sıfırdan kahramana" deneyimiyle ünlüdür. Bir geliştirici, kütüphaneyi kurmaktan VisDrone gibi bir veri kümesi üzerinde özel bir model eğitmeye dakikalar içinde geçebilir.

from ultralytics import YOLO

# Load a pretrained YOLO model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5s.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Karşılaştırmalı olarak, PP-YOLOE+, PaddlePaddle kurulumunu ve PaddleDetection deposunun klonlanmasını gerektirir. Yapılandırma genellikle birden fazla YAML dosyasını değiştirmeyi ve daha karmaşık bir dizin yapısında gezinmeyi içerir, bu da Ultralytics'in Pythonik sadeliğine alışkın olanlar için daha dik bir öğrenme eğrisi sunabilir.

Çok Yönlülük ve Görev Desteği

PP-YOLOE+ öncelikli olarak detect'e odaklanmışken, Ultralytics ekosistemi tek bir API içinde daha geniş bir yelpazede bilgisayar görüşü görevleri için yerel destek sunar:

Örnek Segmentasyon: Nesnelerin hassas maskelenmesi.
Poz Tahmini: İnsan veya hayvan iskeletleri için anahtar nokta algılama.
Yönlendirilmiş Sınırlayıcı Kutu (obb): Döndürülmüş nesneleri algılama, hava görüntüleri için kritik öneme sahiptir.
Sınıflandırma: Tüm görüntü sınıflandırması.

Bu çok yönlülük, geliştiricilerin yeni çerçeveler öğrenmeden veya veri hatlarını yeniden yazmadan görevler arasında geçiş yapmalarına olanak tanır.

Gerçek Dünya Uygulamaları

Ne Zaman PP-YOLOE+ Seçmeli

Altyapınız zaten Baidu'nun teknoloji yığınıyla derinlemesine entegre ise PP-YOLOE+ güçlü bir adaydır. PaddlePaddle'ın baskın çerçeve olduğu bölgelerdeki kullanıcılar veya mAP'nin dağıtım kolaylığına göre tek öncelik olduğu belirli sunucu tarafı dağıtımları için PP-YOLOE+ hala geçerli bir seçenek olmaya devam etmektedir.

Ultralytics YOLO Modellerini Ne Zaman Seçmeli?

Küresel geliştiricilerin, startup'ların ve kurumsal ekiplerin büyük çoğunluğu için Ultralytics YOLOv5 (ve halefleri) aşağıdaki nedenlerden dolayı önerilen seçenektir:

Uç Cihaz Dağıtımı: TFLite, CoreML ve OpenVINO'ya sorunsuz dışa aktarım, modellerin son kullanıcı cihazlarında verimli çalışmasını sağlar.
Topluluk Desteği: Büyük, aktif bir topluluk, sık güncellemelere katkıda bulunarak hataların giderilmesini ve otomatik açıklama gibi yeni özelliklerin düzenli olarak eklenmesini sağlar.
Bütünsel Platform: Ultralytics Platformu, veri kümesi yönetiminden model eğitimine ve bulut dağıtımına kadar tüm yaşam döngüsünü basitleştirir.

Gelecek: YOLO26 ile Tanışın

YOLOv5 sağlam ve güvenilir bir araç olmaya devam etse de, bilgisayar görüşü alanı hızla ilerliyor. Ultralytics, verimlilik ve performansta mutlak son teknolojiyi temsil eden YOLO26'yı yakın zamanda tanıttı.

YOLO26, hem YOLOv5 hem de PP-YOLOE+'a kıyasla çığır açan çeşitli iyileştirmeler sunuyor:

Uçtan Uca NMS-Serbest: YOLO26, çıkarımı yavaşlatan bir son işleme adımı olan NMS'yi (Non-Maximum Suppression) ortadan kaldırır. Bu, daha basit dağıtım mantığı ve daha düşük gecikme süresi sağlar.
MuSGD Optimizasyonu: LLM eğitiminden ilham alan bu hibrit optimize edici, kararlı yakınsama ve daha hızlı eğitim süreleri sağlar.
Gelişmiş Küçük Nesne Algılama: ProgLoss ve STAL (Görev Hizalama Kaybı) aracılığıyla YOLO26, drone denetimi ve hassas tarım için kritik bir yetenek olan küçük nesneleri algılamada üstün başarı gösterir.
%43 Daha Hızlı CPU Çıkarımı: Dağıtım Odak Kaybı'nın (DFL) kaldırılmasıyla YOLO26, CPU'lar için özel olarak optimize edilmiştir ve bu da onu uygun maliyetli uç bilişim için üstün bir seçenek haline getirir.

2026'da yeni projelere başlayan geliştiriciler için, uygulamalarınızı sinir ağı mimarisindeki en son gelişmelerle geleceğe hazır hale getirmek amacıyla YOLO26'yı değerlendirmelerini şiddetle tavsiye ederiz.

YOLO26 hakkında daha fazla bilgi edinin