İçeriğe geç

PP-YOLOE+ ile YOLOv5: Gerçek Zamanlı Nesne Algılama Teknik Karşılaştırması

Bilgisayar görüşünün rekabetçi ortamında, doğru nesne algılama mimarisini seçmek geliştiriciler ve araştırmacılar için kritik bir karardır. Baidu'nun PaddlePaddle tarafından geliştirilen PP-YOLOE+ ve YOLOv5, gerçek zamanlı algılama zorluklarını çözmek için iki farklı yaklaşım olarak Ultralytics çıkmaktadır. PP-YOLOE+ PaddlePaddle bağlantısız mekanizmaları vurgularken, YOLOv5 PyTorch PaddlePaddle kullanılabilirlik, dağıtım esnekliği ve topluluk desteği için endüstri standardını YOLOv5

Bu kılavuz, bu iki etkili modelin mimarilerini, performans ölçütlerini ve üretim otomasyonu ve uç bilgi işlem gibi gerçek dünya uygulamaları için uygunluklarını karşılaştırarak derinlemesine bir teknik analiz sunmaktadır.

Modele Genel Bakış

PP-YOLOE+

PP-YOLOE+, eğitim yakınsaması ve aşağı akış görev performansını iyileştirmek için tasarlanmış PP-YOLOE'nin bir evrimidir. PaddlePaddle göre çalışır ve algılama başlığını basitleştirmek için çapa içermeyen bir paradigma kullanır. Daha güçlü bir backbone rafine eğitim stratejileri ekleyerek, bulut tabanlı çıkarımın yaygın olduğu endüstriyel uygulamalar için yüksek hassasiyet sağlamayı amaçlamaktadır.

Ultralytics YOLOv5

YOLOv5 nesne algılamada kullanıcı deneyiminde devrim yarattı. Ultralytics tarafından piyasaya sürülen bu ürün, "önce dağıtım" mühendisliğine öncelik vererek modellerin sadece doğru olmasını değil, aynı zamanda çeşitli donanımlarda eğitilmesi, dışa aktarılması ve çalıştırılmasının da son derece kolay olmasını sağlar. Çapa tabanlı mimarisi hız açısından son derece optimize edilmiştir, bu da onu uç cihazlarda gerçek zamanlı çıkarım için favori bir seçenek haline getirir.

YOLOv5 hakkında daha fazla bilgi edinin.

Teknik Mimari Karşılaştırması

PP-YOLOE+ ve YOLOv5 in mimari felsefeleri önemli ölçüde YOLOv5 ve bu da onların eğitim davranışlarını ve dağıtım özelliklerini etkiler.

Backbone ve Özellik Çıkarımı

YOLOv5 CSPDarknet (Cross Stage Partial Network) backbone kullanır. Bu tasarım, performanstan ödün vermeden gradyan akışını iyileştirir ve parametre sayısını azaltır. Mimari oldukça modülerdir ve farklı model derinlikleri ve genişlikleri (Nano'dan X-Large'a) ile hızlı denemeler yapılmasına olanak tanır. Bu modülerlik, Raspberry Pi veya mobil cihazlar gibi kaynakları sınırlı ortamlara dağıtım yapan geliştiriciler için çok önemlidir.

PP-YOLOE+ ise, genellikle CSPRepResStage backbone kullanır ve bu backbone, kalıntı bağlantıları yeniden parametreleştirme teknikleriyle birleştirir. Zengin özellikleri çıkarmak için etkili olsa da, bu yapı, YOLOv5 uygulamasının akıcı verimliliğine kıyasla, eğitim aşamasında genellikle daha yüksek karmaşıklığa neden olur.

Algılama Başlıkları: Ankrajlı ve Ankrajsız

Temel fark, algılama başlıklarında yatmaktadır:

  1. YOLOv5 Anchor-Based): Nesnelerin konumlarını tahmin etmek için önceden tanımlanmış bağlantı kutuları kullanır. Bu, ilk yapılandırma gerektirir ( Ultralytics , AutoAnchor aracılığıyla bunu Ultralytics ), ancak standart veri kümelerinde istikrarlı eğitim gradyanları ve tarihsel olarak sağlam performans sağlar. COCOgibi standart veri kümelerinde istikrarlı eğitim gradyanları ve tarihsel olarak sağlam performans sağlar.
  2. PP-YOLOE+ (Anchor-Free): Nesne merkezlerini ve boyutlarını doğrudan tahmin ederek, anchor box hiperparametre ayarlamasına olan ihtiyacı ortadan kaldırır. Bu yaklaşım, aşırı en boy oranlarına sahip nesneleri iyi bir şekilde işler, ancak eğitim verilerinin kalitesine ve ilk kayıp yakınsamasına daha duyarlı olabilir.

Çapa Kullanmadan Evrim

YOLOv5 , çapaları YOLOv5 kullanırken, YOLOv8 gibi daha yeni Ultralytics YOLOv8 ve en son teknoloji ürünü YOLO26 gibi daha yeni Ultralytics modelleri, her iki dünyanın en iyi özelliklerini bir araya getiren, kullanım kolaylığı ve üstün geometrik genelleme özelliklerine sahip, çapa içermeyen tasarımlara geçiş yapmıştır.

Performans Metrikleri

Performansı değerlendirirken, ortalama hassasiyet (mAP) ve gecikme süresi arasındaki dengeyi göz önünde bulundurmak çok önemlidir. Aşağıdaki tablo, PP-YOLOE+'nın yüksek doğruluk elde ederken, YOLOv5 CPU ve dağıtım çok yönlülüğü açısından rekabet avantajı YOLOv5 ve yeni kullanıcılar için giriş engellerinin önemli ölçüde daha düşük olduğunu göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Hız ve Verimlilik Analizi

Ultralytics YOLOv5 , özellikle "Nano" ve "Small" varyantlarında olağanüstü verimlilikYOLOv5 . Sadece 1,9 milyon parametreye sahip YOLOv5n modeli, mobil uygulamalar veya IoT sensörleri gibi son derece kısıtlı ortamlar için özel olarak tasarlanmıştır. PP-YOLOE+ güçlü mAP sunarken, kurulum karmaşıklığı ve PaddlePaddle bağımlılık, standart PyTorch ONNX dayanan üretim süreçlerinde sürtüşmelere neden olabilir.

Ayrıca, bellek gereksinimleri YOLOv5 tercih etmektedir. Eğitim sırasında, YOLOv5 optimize edilmiş veri yükleyicileri ve bellek yönetimi, birçok rakibe kıyasla tüketici sınıfı GPU'larda daha büyük parti boyutlarına olanak tanıyarak AI mühendisleri için donanım engelini azaltmaktadır.

Eğitim ve Ekosistem

Bir modeli çevreleyen ekosistem, genellikle modelin kendisi kadar önemlidir. Ultralytics , bu noktada belirgin bir avantaj Ultralytics .

Kullanım Kolaylığı ve Belgeleme

YOLOv5 , "sıfırdan kahramana" deneyimiyle YOLOv5 . Bir geliştirici, kütüphaneyi yüklemekten VisDrone gibi bir veri setinde özel bir model eğitmeye dakikalar içinde geçebilir.

from ultralytics import YOLO

# Load a pretrained YOLO model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5s.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Buna karşılık, PP-YOLOE+ için PaddlePaddle kurulması PaddlePaddle PaddleDetection deposunun klonlanması gerekir. Yapılandırma genellikle birden fazla YAML dosyasının değiştirilmesini ve daha karmaşık bir dizin yapısında gezinmeyi gerektirir. Bu da, Ultralytics Pythonic basitliğine alışkın olanlar için daha zor bir öğrenme eğrisi anlamına gelebilir.

Çok Yönlülük ve Görev Desteği

PP-YOLOE+ öncelikle algılama üzerine odaklanırken, Ultralytics tek bir API içinde daha geniş bir yelpazede görme görevleri için yerel destek sunar:

Bu çok yönlülük, geliştiricilerin yeni çerçeveler öğrenmeden veya veri boru hatlarını yeniden yazmadan görevler arasında geçiş yapabilmelerini sağlar.

Gerçek Dünya Uygulamaları

Ne Zaman PP-YOLOE+ Seçmeli

Altyapınız Baidu'nun teknoloji yığınıyla zaten derinlemesine entegre edilmişse, PP-YOLOE+ güçlü bir adaydır. PaddlePaddle baskın çerçeve PaddlePaddle bölgelerdeki kullanıcılar veya dağıtım kolaylığından çok mAP tek öncelik mAP belirli sunucu tarafı dağıtımları için PP-YOLOE+ geçerli bir seçenek olmaya devam etmektedir.

Ultralytics YOLO Ne Zaman Seçmelisiniz?

Küresel geliştiricilerin, girişimlerin ve kurumsal ekiplerin büyük çoğunluğu için, Ultralytics YOLOv5 (ve onun halefleri) aşağıdaki nedenlerle önerilen seçimdir:

  1. Edge Dağıtımı: TFLite'a sorunsuz dışa aktarım TFLite, CoreML ve OpenVINO 'ya sorunsuz aktarım, modellerin son kullanıcı cihazlarında verimli bir şekilde çalışmasını sağlar.
  2. Topluluk Desteği: Büyük ve aktif bir topluluk, sık güncellemeler yapılmasına katkıda bulunarak hataların giderilmesini ve otomatik açıklama gibi yeni özelliklerin düzenli olarak eklenmesini sağlar.
  3. Bütünsel Platform: Ultralytics , veri kümesi yönetiminden model eğitimi ve bulut dağıtımına kadar tüm yaşam döngüsünü basitleştirir.

Gelecek: YOLO26'ya girin

YOLOv5 sağlam ve güvenilir bir araç YOLOv5 de, bilgisayar görme alanı hızla gelişmektedir. Ultralytics kısa süre önce YOLO26'yi piyasaya sürdü.

YOLO26, hem YOLOv5 PP-YOLOE+'ya göre birçok çığır açan iyileştirme sunar:

  • Uçtan Uca NMS: YOLO26, çıkarımları yavaşlatan bir son işlem adımı olan Maksimum Baskılama (NMS) özelliğini ortadan kaldırır. Bu sayede daha basit bir dağıtım mantığı ve daha düşük gecikme süresi elde edilir.
  • MuSGD Optimizer: LLM eğitiminden esinlenilen bu hibrit optimizer, istikrarlı yakınsama ve daha hızlı eğitim süreleri sağlar.
  • Geliştirilmiş Küçük Nesne Algılama: ProgLoss ve STAL (Görev Hizalama Kaybı) sayesinde YOLO26, drone denetimi ve hassas tarım için kritik öneme sahip olan küçük nesneleri algılamada üstün performans gösterir.
  • %43 Daha Hızlı CPU : Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasıyla YOLO26, CPU'lar için özel olarak optimize edildi ve maliyet etkin uç bilgi işlem için üstün bir seçim haline geldi.

2026 yılında yeni projeler başlatan geliştiriciler için, sinir ağı mimarisindeki en son gelişmelerle uygulamalarınızı geleceğe hazır hale getirmek için YOLO26'yı değerlendirmenizi şiddetle tavsiye ederiz.

YOLO26 hakkında daha fazla bilgi edinin


Yorumlar