İçeriğe geç

PP-YOLOE+ ve YOLOv5: Nesne detect Mimarisinde Gezinme

Bilgisayar görüşü için doğru derin öğrenme çerçevesini seçerken, geliştiriciler genellikle hız, doğruluk ve dağıtım kolaylığının mükemmel dengesini bulmak için farklı mimarilerin yeteneklerini karşılaştırırlar. Bu derinlemesine incelemede, PP-YOLOE+ ve YOLOv5 arasındaki teknik nüansları keşfedeceğiz. Mimarlarını, performans metriklerini ve ideal dağıtım senaryolarını analiz ederek, gerçek zamanlı robotik, kenar dağıtımı veya bulut tabanlı video analizi içeren bir sonraki projeniz için bilinçli bir karar verebilirsiniz.

Model Kökenleri ve Meta Verileri

Her iki model de oldukça yetenekli mühendislik ekiplerinden gelmekle birlikte, biraz farklı ekosistemleri hedeflemektedir. Kökenlerini anlamak, mimari tasarım seçimleri için değerli bir bağlam sağlar.

PP-YOLOE+ Detayları:

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLOv5 Detayları:

YOLOv5 hakkında daha fazla bilgi edinin.

Mimari Karşılaştırma

PP-YOLOE+ Mimarisi

PP-YOLOE+, PP-YOLOv2 gibi önceki modellerin temeli üzerine inşa edilmiş, Baidu ekosistemi içinde bir evrimdir. Son derece optimize edilmiş bir CSPRepResNet backbone sunar; bu, Cross Stage Partial (CSP) ağlarının prensiplerini yeniden parametrelendirme teknikleriyle birleştirerek özellik çıkarımını geliştirir. Bu, modelin eğitim sırasında yüksek doğruluğu korumasını sağlarken, daha hızlı çıkarım için daha akıcı bir mimariye dönüşmesine olanak tanır.

Ek olarak, PP-YOLOE+, Görev Hizalama Öğrenimi (TAL) ve Verimli Görev Hizalı başlık (ET-head) kullanır. Bu kombinasyon, sınıflandırma ve yerelleştirme görevleri arasındaki hizalama sorununu çözmeyi amaçlar; bu, yoğun nesne detect'örlerinde yaygın bir darboğazdır. Yapısal olarak etkileyici olsa da, mimari PaddlePaddle framework'ü ile sıkı bir şekilde bağlıdır ve bu da diğer ana akım ML kütüphanelerinde standartlaşan ekipler için entegrasyon zorlukları yaratabilir.

YOLOv5 Mimarisi

Buna karşılık, YOLOv5, hem akademik araştırma hem de kurumsal üretim için endüstri standardı olan PyTorch içinde yerel olarak tasarlanmıştır. Olağanüstü gradyan akışı ve parametre verimliliği ile bilinen değiştirilmiş bir CSPDarknet53 backbone kullanır.

YOLOv5'in bir özelliği, eğitimden önce belirli özel veri setinize göre anchor kutusu boyutlarını dinamik olarak kontrol eden ve ayarlayan AutoAnchor algoritmasıdır. Bu, sınırlayıcı kutular için manuel hiperparametre ayarını ortadan kaldırır. Modelin Yol Toplama Ağı (PANet) boynu, sağlam çok ölçekli özellik füzyonunu sağlayarak, farklı boyutlardaki nesneleri detect etmede oldukça etkili olmasını sağlar.

Akıcı PyTorch Dağıtımı

YOLOv5 doğrudan PyTorch üzerine inşa edildiği için, ONNX ve TensorRT gibi optimize edilmiş formatlara dışa aktarma, yerelleştirilmiş framework'lere bağlı modellere göre önemli ölçüde daha az ara yazılım yapılandırması gerektirir.

Performans Analizi

Bu modelleri değerlendirmek, ortalama Hassasiyet (mAP) ile gecikme arasındaki dengeyi incelemeyi gerektirir. Aşağıdaki tablo, farklı model boyutlarındaki metrikleri göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

PP-YOLOE+, daha büyük ölçeklerde (X varyantı gibi) oldukça rekabetçi mAP skorları elde etse de, YOLOv5 üstün hız ve daha düşük parametre sayıları sunar spektrumun daha küçük ucunda. YOLOv5 Nano (YOLOv5n) yalnızca 2.6 milyon parametre gerektirir, bu da onu bellek gereksinimlerinin katı olduğu kısıtlı kenar cihazlar için oldukça uygun hale getirir. Ayrıca, YOLO modellerini eğitmek, ağır transformatör tabanlı alternatiflere kıyasla genellikle daha az CUDA belleği tüketir. RT-DETR.

Ultralytics'in Avantajı

Bir mimari seçerken, ham metrikler denklemin yalnızca bir parçasıdır. Geliştirici deneyimi, ekosistem desteği ve dağıtım hatları genellikle bir projenin gerçek dünya başarısını belirler. Ultralytics modelleri işte burada öne çıkar.

Eşsiz Kullanım Kolaylığı

Ultralytics için Python API'si, karmaşık şablon kodlarını soyutlar. Geliştiriciler eğitimi başlatabilir, performansı doğrulayabilir ve modelleri sorunsuz bir şekilde dağıtabilir. Dokümantasyon kapsamlıdır, yüksek düzeyde bakımı yapılır ve büyük bir küresel açık kaynak topluluğu tarafından desteklenir.

Görevler Arası Çok Yönlülük

PP-YOLOE+ özel bir nesne detectörü olsa da, Ultralytics ekosistemi kullanıcıların tek bir birleşik API altında birden fazla bilgisayar görüşü görevini ele almasına olanak tanır. YOLOv5 ve halefleri ile standart sınırlayıcı kutulardan Görüntü Segmentasyonuna ve sınıflandırma iş akışlarına zahmetsizce geçiş yapabilirsiniz.

Kod Örneği: YOLOv5 Eğitimi

Başlamak yalnızca birkaç satır kod gerektirir. Bu basitlik, araştırma ve geliştirme döngülerini önemli ölçüde hızlandırır.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Gerçek Dünya Kullanım Durumları

PP-YOLOE+ Ne Zaman Seçilmeli: Kuruluşunuz Baidu yazılım yığınına derinden entegre ise veya PaddlePaddle çerçevesini zorunlu kılan özel donanımlara büyük ölçüde güveniyorsa, PP-YOLOE+ sağlam bir performans sergiler. Asya'daki özel üretim hatlarında, Paddle ile eski entegrasyonun bulunduğu yerlerde sıkça kullanılır.

YOLOv5 Ne Zaman Seçilmeli: Uluslararası geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için YOLOv5 bir güç merkezi olmaya devam etmektedir. PyTorch kökenleri, izleme için Weights & Biases gibi araçlarla anında uyumlu olduğu ve NVIDIA GPU hızlandırması için TensorRT veya Apple cihazları için CoreML'e sorunsuz bir şekilde dışa aktarıldığı anlamına gelir. Tarımsal ürün izlemeden yüksek hızlı drone navigasyonuna kadar çeşitli alanlarda üstün performans gösterir.

detect'in Geleceği: Ultralytics YOLO26

YOLOv5 ikonik bir model olsa da, bilgisayar görüşü sınırı ilerlemiştir. Tüm yeni geliştirmeler için, Ocak 2026'da piyasaya sürülen YOLO26'ya geçiş yapmanızı şiddetle tavsiye ederiz. Ultralytics Platformu aracılığıyla sorunsuz bir şekilde erişilebilen YOLO26, verimliliği tamamen yeniden tanımlıyor.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26'daki Temel Yenilikler:

  • Uçtan Uca NMS-Serbest Tasarım: YOLO26, Maksimum Olmayan Bastırma (Non-Maximum Suppression) son işlemeyi tamamen ortadan kaldırır. Bu, gecikme değişkenliğini azaltır ve dağıtım hattını önemli ölçüde basitleştirir.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağıtım Odak Kaybı (DFL) stratejik olarak kaldırılarak, YOLO26 GPU'suz kenar cihazlarda hızı önemli ölçüde artırır.
  • MuSGD Optimize Edici: Önde gelen Büyük Dil Modellerinden esinlenilen bu hibrit optimize edici, eğitim dinamiklerini stabilize eder ve özel veri kümelerinde çok daha hızlı yakınsamaya olanak tanır.
  • Göreve Özel İyileştirmeler: ProgLoss ve STAL gibi gelişmiş kayıp fonksiyonlarına sahiptir, bu da küçük nesnelerde eşi benzeri görülmemiş bir doğruluk sağlar. Hava görüntüleri için Yönlendirilmiş Sınırlayıcı Kutu (OBB) detect etmeyi doğal olarak destekler.

Son teknoloji görüş modellerini araştırıyorsanız, önceki nesil YOLO11 veya RT-DETR gibi transformatör tabanlı yaklaşımları karşılaştırmakla da ilgilenebilirsiniz. Sonuç olarak, sağlam ekosistem, son teknoloji mimari gelişmelerle birleştiğinde, Ultralytics'i modern bilgisayar görüşü görevleri için önde gelen bir seçenek haline getirir.


Yorumlar