İçeriğe geç

PP-YOLOE+ ve YOLOv5: Nesne detect Mimarisinde Gezinme

Bilgisayar görüşü için doğru derin öğrenme çerçevesini seçerken, geliştiriciler genellikle hız, doğruluk ve dağıtım kolaylığının mükemmel dengesini bulmak için farklı mimarilerin yeteneklerini karşılaştırırlar. Bu derinlemesine incelemede, PP-YOLOE+ ve YOLOv5 arasındaki teknik nüansları keşfedeceğiz. Mimarlarını, performans metriklerini ve ideal dağıtım senaryolarını analiz ederek, gerçek zamanlı robotik, kenar dağıtımı veya bulut tabanlı video analizi içeren bir sonraki projeniz için bilinçli bir karar verebilirsiniz.

Model Kökenleri ve Meta Verileri

Her iki model de oldukça yetenekli mühendislik ekiplerinden gelmekle birlikte, biraz farklı ekosistemleri hedeflemektedir. Kökenlerini anlamak, mimari tasarım seçimleri için değerli bir bağlam sağlar.

PP-YOLOE+ Detayları:

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLOv5 Detayları:

YOLOv5 hakkında daha fazla bilgi edinin.

Mimari Karşılaştırma

PP-YOLOE+ Mimarisi

PP-YOLOE+, PP-YOLOv2 gibi önceki modellerin temeli üzerine inşa edilmiş, Baidu ekosistemi içinde bir evrimdir. Son derece optimize edilmiş bir CSPRepResNet backbone sunar; bu, Cross Stage Partial (CSP) ağlarının prensiplerini yeniden parametrelendirme teknikleriyle birleştirerek özellik çıkarımını geliştirir. Bu, modelin eğitim sırasında yüksek doğruluğu korumasını sağlarken, daha hızlı çıkarım için daha akıcı bir mimariye dönüşmesine olanak tanır.

Ek olarak, PP-YOLOE+, Görev Hizalama Öğrenimi (TAL) ve Verimli Görev Hizalı başlık (ET-head) kullanır. Bu kombinasyon, sınıflandırma ve yerelleştirme görevleri arasındaki hizalama sorununu çözmeyi amaçlar; bu, yoğun nesne detect'örlerinde yaygın bir darboğazdır. Yapısal olarak etkileyici olsa da, mimari PaddlePaddle framework'ü ile sıkı bir şekilde bağlıdır ve bu da diğer ana akım ML kütüphanelerinde standartlaşan ekipler için entegrasyon zorlukları yaratabilir.

YOLOv5 Mimarisi

Buna karşılık, YOLOv5, hem akademik araştırma hem de kurumsal üretim için endüstri standardı olan PyTorch içinde yerel olarak tasarlanmıştır. Olağanüstü gradyan akışı ve parametre verimliliği ile bilinen değiştirilmiş bir CSPDarknet53 backbone kullanır.

YOLOv5'in bir özelliği, eğitimden önce belirli özel veri setinize göre anchor kutusu boyutlarını dinamik olarak kontrol eden ve ayarlayan AutoAnchor algoritmasıdır. Bu, sınırlayıcı kutular için manuel hiperparametre ayarını ortadan kaldırır. Modelin Yol Toplama Ağı (PANet) boynu, sağlam çok ölçekli özellik füzyonunu sağlayarak, farklı boyutlardaki nesneleri detect etmede oldukça etkili olmasını sağlar.

Akıcı PyTorch Dağıtımı

YOLOv5 doğrudan PyTorch üzerine inşa edildiği için, ONNX ve TensorRT gibi optimize edilmiş formatlara dışa aktarma, yerelleştirilmiş framework'lere bağlı modellere göre önemli ölçüde daha az ara yazılım yapılandırması gerektirir.

Performans Analizi

Bu modelleri değerlendirmek için ortalama hassasiyet (mAP) ve gecikme süresi arasındaki dengelemeyi incelemek gerekir. Aşağıdaki tablo, farklı model boyutlarındaki metrikleri göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

PP-YOLOE+, daha büyük ölçeklerde (X varyantı gibi) oldukça rekabetçi mAP elde ederken, YOLOv5 , üstün hız ve daha düşük parametre sayısı YOLOv5 . spektrumun daha küçük ucunda. YOLOv5 (YOLOv5n) yalnızca 2,6 milyon parametre gerektirir, bu da bellek gereksinimlerinin katı olduğu kısıtlı kenar cihazları için son derece uygun olmasını sağlar. Ayrıca, YOLO eğitimi, ağır transformatör tabanlı alternatiflere kıyasla genellikle daha az CUDA tüketir. RT-DETR.

Ultralytics'in Avantajı

Bir mimari seçerken, ham metrikler denklemin sadece bir parçasıdır. Geliştirici deneyimi, ekosistem desteği ve dağıtım süreçleri genellikle bir projenin gerçek hayattaki başarısını belirler. Ultralytics işte bu noktada öne çıkar.

Eşsiz Kullanım Kolaylığı

Ultralytics için Python , karmaşık şablon kodlarını ortadan Ultralytics . Geliştiriciler, eğitimi başlatabilir, performansı doğrulayabilir ve modelleri sorunsuz bir şekilde dağıtabilir. Belgeler kapsamlıdır, sık sık güncellenir ve büyük bir küresel açık kaynak topluluğu tarafından desteklenir.

Görevler Arası Çok Yönlülük

PP-YOLOE+ özel bir nesne algılayıcı olsa da, Ultralytics kullanıcıların tek bir birleşik API altında birden fazla bilgisayar görme görevini yerine getirmelerine olanak tanır. YOLOv5 ve onun halefleri ile standart sınırlayıcı kutulardan Görüntü Segmentasyonu ve sınıflandırma iş akışlarına zahmetsizce geçiş yapabilirsiniz.

Kod Örneği: YOLOv5 Eğitimi

Başlamak için sadece birkaç satır kod yazmak yeterlidir. Bu basitlik, araştırma ve geliştirme döngülerini önemli ölçüde hızlandırır.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Gerçek Dünya Kullanım Durumları

PP-YOLOE+'yı ne zaman seçmelisiniz: Kuruluşunuz Baidu yazılım yığınına derinlemesine entegre edilmişse veya PaddlePaddle zorunlu kılan özel donanıma büyük ölçüde bağımlıysa, PP-YOLOE+ sağlam bir performans sergiler. Paddle ile eski entegrasyonun mevcut olduğu Asya'daki özel üretim hatlarında sıklıkla kullanılır.

YOLOv5 ne zaman seçmelisiniz: Uluslararası geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için YOLOv5 güçlü bir YOLOv5 . PyTorch olması, aşağıdaki gibi araçlarla anında uyumlu olduğu anlamına gelir Weights & Biases gibi araçlarla anında uyumludur ve TensorRT veya NVIDIA cihazları CoreML GPU . Tarımsal ürün izlemeden yüksek hızlı drone navigasyonuna kadar çeşitli alanlarda mükemmeldir.

detect'in Geleceği: Ultralytics YOLO26

YOLOv5 ikonik bir model YOLOv5 , bilgisayar görme teknolojisi alanında önemli gelişmeler kaydedilmiştir. Tüm yeni geliştirmeler için, Ocak 2026'da piyasaya sürülen YOLO26'ya geçiş yapmanızı şiddetle tavsiye ederiz. Ultralytics üzerinden sorunsuz bir şekilde kullanılabilen YOLO26, verimliliği tamamen yeniden tanımlamaktadır.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26'daki Önemli Yenilikler:

  • Uçtan Uca NMS Tasarım: YOLO26, Non-Maximum Suppression son işlemesini tamamen ortadan kaldırır. Bu, gecikme değişkenliğini azaltır ve dağıtım sürecini büyük ölçüde basitleştirir.
  • %43'e kadar daha hızlı CPU : Dağıtım Odak Kaybını (DFL) stratejik olarak ortadan kaldırarak, YOLO26 GPU'su olmayan uç cihazlarda hızı önemli ölçüde artırır.
  • MuSGD Optimizer: Önde gelen Büyük Dil Modellerinden esinlenerek geliştirilen bu hibrit optimizer, eğitim dinamiklerini stabilize eder ve özel veri kümelerinde çok daha hızlı yakınsama sağlar.
  • Göreve Özel Geliştirmeler: ProgLoss ve STAL gibi gelişmiş kayıp fonksiyonları ile küçük nesnelerde benzeri görülmemiş bir doğruluk sağlar. Hava görüntülerinde Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamasını yerel olarak destekler.

En son teknolojiye sahip görüntü modellerini araştırıyorsanız, önceki nesli karşılaştırmak da ilginizi çekebilir YOLO11 veya RT-DETRgibi transformatör tabanlı yaklaşımları karşılaştırmak da ilginizi çekebilir. Sonuç olarak, sağlam ekosistem ve en son mimari gelişmeler, Ultralytics modern bilgisayar görme görevleri için en iyi seçim Ultralytics getiriyor.


Yorumlar