PP-YOLOE+ ve YOLOv5: Nesne Algılama Mimarilerinde Yol Bulma

Bilgisayarlı görü için doğru derin öğrenme çerçevesini seçerken, geliştiriciler genellikle hız, doğruluk ve dağıtım kolaylığı arasında mükemmel dengeyi bulmak adına farklı mimarilerin yeteneklerini karşılaştırırlar. Bu derinlemesine incelemede, PP-YOLOE+ ile YOLOv5 arasındaki teknik nüansları keşfedeceğiz. Mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını analiz ederek, ister gerçek zamanlı robotik, ister uç cihazda dağıtım veya bulut tabanlı video analitiği olsun, bir sonraki projeniz için bilinçli bir karar verebilirsiniz.

Model Kökenleri ve Meta Verileri

Her iki model de oldukça yetenekli mühendislik ekiplerinden çıkmıştır ancak biraz farklı ekosistemleri hedeflerler. Kökenlerini anlamak, mimari tasarım seçimleri için değerli bir bağlam sağlar.

PP-YOLOE+ Detayları:

PP-YOLOE+ hakkında daha fazla bilgi edin

YOLOv5 Detayları:

YOLOv5 hakkında daha fazla bilgi edin

Mimari Karşılaştırma

PP-YOLOE+ Mimarisi

PP-YOLOE+, PP-YOLOv2 gibi önceki modellerin temel üzerine inşa edilmiş, Baidu ekosistemi içinde bir evrimdir. Çapraz Aşamalı Kısmi (CSP) ağların prensiplerini yeniden parametrelendirme teknikleriyle birleştirerek özellik çıkarımını geliştiren, yoğun şekilde optimize edilmiş bir CSPRepResNet omurgası sunar. Bu, modelin eğitim sırasında yüksek doğruluğu korurken daha hızlı çıkarım için daha sade bir mimariye büzülmesine olanak tanır.

Ek olarak, PP-YOLOE+ Görev Hizalama Öğrenimi (TAL) ve Verimli Görev Hizalı başlık (ET-head) kullanır. Bu kombinasyon, yoğun nesne dedektörlerinde yaygın bir darboğaz olan sınıflandırma ve yerelleştirme görevleri arasındaki uyumsuzluğu çözmeyi amaçlar. Yapısal olarak etkileyici olsa da, mimari PaddlePaddle framework ile sıkı bir şekilde bağlantılıdır, bu da diğer ana akım ML kütüphaneleri üzerinde standartlaşan ekipler için entegrasyon zorlukları oluşturabilir.

YOLOv5 Mimarisi

Buna karşılık YOLOv5, hem akademik araştırmalar hem de kurumsal üretim için endüstri standardı olan PyTorch içinde yerel olarak geliştirilmiştir. Olağanüstü gradyan akışı ve parametre verimliliği ile bilinen, değiştirilmiş bir CSPDarknet53 omurgası kullanır.

YOLOv5'in ayırt edici bir özelliği, eğitim öncesinde özel veri setine dayalı olarak çapa kutusu boyutlarını dinamik olarak kontrol eden ve ayarlayan AutoAnchor algoritmasıdır. Bu, sınırlayıcı kutular için manuel hiperparametre ayarını ortadan kaldırır. Modelin Yol Birleştirme Ağı (PANet) boyun yapısı, sağlam çok ölçekli özellik füzyonu sağlar ve bu da onu değişen boyutlardaki nesneleri tespit etmede oldukça etkili kılar.

Kolaylaştırılmış PyTorch Dağıtımı

YOLOv5 doğrudan PyTorch üzerine inşa edildiğinden, ONNX ve TensorRT gibi optimize edilmiş formatlara dışa aktarma, yerel çerçevelere bağlı modellere kıyasla çok daha az ara yazılım yapılandırması gerektirir.

Performans Analizi

Bu modelleri değerlendirmek, ortalama Hassasiyet (mAP) ile gecikme arasındaki dengeye bakmayı gerektirir. Aşağıdaki tablo, farklı model boyutlarındaki metrikleri göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

PP-YOLOE+ daha büyük ölçeklerde (X varyantı gibi) oldukça rekabetçi mAP puanları elde ederken, YOLOv5 spektrumun küçük ucunda üstün hız ve daha düşük parametre sayıları sunar. YOLOv5 Nano (YOLOv5n) yalnızca 2,6 milyon parametre gerektirir, bu da onu bellek gereksinimlerinin katı olduğu kısıtlı uç cihazlar için oldukça uygun hale getirir. Ayrıca, YOLO modellerini eğitmek, RT-DETR gibi ağır transformatör tabanlı alternatiflere kıyasla tipik olarak daha az CUDA belleği tüketir.

Ultralytics Avantajı

Bir mimari seçerken, ham metrikler denklemin sadece bir parçasıdır. Geliştirici deneyimi, ekosistem desteği ve dağıtım hatları genellikle bir projenin gerçek dünyadaki başarısını belirler. Ultralytics modellerinin parladığı yer tam olarak burasıdır.

Eşsiz Kullanım Kolaylığı

Ultralytics için Python API, karmaşık ortak kodları ortadan kaldırır. Geliştiriciler eğitimi başlatabilir, performansı doğrulayabilir ve modelleri sorunsuz bir şekilde dağıtabilirler. Belgeler kapsamlıdır, sürekli güncel tutulur ve devasa bir küresel açık kaynak topluluğu tarafından desteklenir.

Görevler Arasında Çok Yönlülük

PP-YOLOE+ özel bir nesne dedektörü iken, Ultralytics ekosistemi kullanıcıların tek bir birleşik API altında birden fazla bilgisayarlı görü görevini ele almasına olanak tanır. YOLOv5 ve halefleri ile, standart sınırlayıcı kutulardan Görüntü Segmentasyonu ve sınıflandırma iş akışlarına zahmetsizce geçiş yapabilirsin.

Kod Örneği: YOLOv5 Eğitimi

Başlamak yalnızca birkaç satır kod gerektirir. Bu basitlik, araştırma ve geliştirme döngülerini önemli ölçüde hızlandırır.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Gerçek Dünya Kullanım Durumları

PP-YOLOE+ ne zaman seçilmeli: Kuruluşun Baidu yazılım yığınına derinlemesine gömülüyse veya PaddlePaddle çerçevesini zorunlu kılan özel donanımlara büyük ölçüde güveniyorsa, PP-YOLOE+ sağlam bir performans sergileyen bir modeldir. Paddle ile eski entegrasyonun mevcut olduğu Asya genelindeki özel üretim hatlarında sıklıkla kullanılır.

YOLOv5 ne zaman seçilmeli: Uluslararası geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için YOLOv5 bir güç merkezi olmaya devam ediyor. PyTorch kökleri, onu takip için Weights & Biases gibi araçlarla anında uyumlu hale getirir ve NVIDIA GPU hızlandırması için TensorRT veya Apple cihazları için CoreML'e temiz bir şekilde dışa aktarılır. Tarımsal ürün izlemeden yüksek hızlı drone navigasyonuna kadar çok çeşitli alanlarda mükemmeldir.

Algılamanın Geleceği: Ultralytics YOLO26

YOLOv5 ikonik bir model olsa da, bilgisayarlı görünün sınırı ilerledi. Tüm yeni geliştirmeler için, Ocak 2026'da piyasaya sürülen YOLO26'ya geçmenizi şiddetle tavsiye ederiz. Ultralytics Platform aracılığıyla sorunsuz bir şekilde erişilebilen YOLO26, verimliliği tamamen yeniden tanımlıyor.

YOLO26 hakkında daha fazla bilgi edin

YOLO26'daki Temel Yenilikler:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Maksimum Olmayan Bastırma (NMS) sonrası işlemeyi tamamen ortadan kaldırır. Bu, gecikme değişkenliğini azaltır ve dağıtım hattını önemli ölçüde basitleştirir.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağılım Odaklı Kaybı (DFL) stratejik olarak kaldırarak, YOLO26 GPU'suz uç cihazlarda hızı önemli ölçüde artırır.
  • MuSGD Optimize Edici: Önde gelen Büyük Dil Modellerinden esinlenen bu hibrit optimize edici, eğitim dinamiklerini stabilize eder ve özel veri setlerinde çok daha hızlı yakınsamaya olanak tanır.
  • Göreve Özel İyileştirmeler: ProgLoss ve STAL gibi gelişmiş kayıp fonksiyonlarını içeren bu özellik, küçük nesnelerde benzeri görülmemiş bir doğruluk sağlar. Hava görüntüleri için Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamasını yerel olarak destekler.

En son teknoloji vizyon modellerini keşfediyorsan, önceki nesil YOLO11 veya RT-DETR gibi transformatör tabanlı yaklaşımları karşılaştırmakla da ilgilenebilirsin. Nihayetinde, en son mimari gelişmelerle birleşen sağlam ekosistem, Ultralytics'i modern bilgisayarlı görü görevleri için bir numaralı tercih haline getiriyor.

Yorumlar