İçeriğe geç

YOLOv5 - PP-YOLOE+: Nesne Algılama için Teknik Bir Karşılaştırma

Optimal nesne algılama modelini seçmek, bilgisayar görüşü projelerinin verimliliğini, doğruluğunu ve ölçeklenebilirliğini etkileyen çok önemli bir karardır. Bu kapsamlı kılavuz, kullanılabilirliği ve hızıyla ünlü efsanevi bir model olan Ultralytics YOLOv5'i, Baidu'nun PaddlePaddle ekosisteminden yüksek doğruluklu bir model olan PP-YOLOE+'a karşı karşılaştırmaktadır. Mimarilerini, performans metriklerini ve dağıtım iş akışlarını analiz ederek, geliştiricilerin ve araştırmacıların özel ihtiyaçları için en iyi çözümü seçmelerine yardımcı olmayı amaçlıyoruz.

Ultralytics YOLOv5: Kullanılabilirlik ve Hız Standardı

Ultralytics tarafından 2020'de piyasaya sürülen YOLOv5, son teknoloji nesne algılamayı herkes için erişilebilir kılarak vizyon yapay zekasının manzarasını temelden değiştirdi. Önceki sürümlerinden farklı olarak, küresel veri bilimi topluluğu için eğitim ve dağıtım sürecini basitleştiren, yerel olarak PyTorch ile uygulanan ilk YOLO modeliydi. Tasarım felsefesi, inanılmaz derecede kullanıcı dostu bir ekosistemde paketlenmiş gerçek zamanlı çıkarım hızı ve yüksek doğruluk arasında bir dengeye öncelik veriyor.

Yazarlar: Glenn Jocher
Kuruluş:Ultralytics
Tarih: 2020-06-26
GitHub:https://github.com/ultralytics/yolov5
Belgeler:https://docs.ultralytics.com/models/yolov5/

Temel Güçlü Yönler

  • Kullanım Kolaylığı: YOLOv5, "kullanıma hazır" deneyimiyle ünlüdür. Kolaylaştırılmış bir Python API ve sezgisel CLI komutları ile geliştiriciler dakikalar içinde özel veri kümeleri üzerinde eğitime başlayabilir.
  • İyi Yönetilen Ekosistem: Ultralytics tarafından desteklenmektedir, sık güncellemelerden ve büyük, aktif bir topluluktan yararlanır. Bu, uzun vadeli desteği ve GitHub Sorunları gibi platformlarda paylaşılan bilgi birikimini sağlar.
  • Performans Dengesi: Önemli doğruluktan ödün vermeden, özellikle Raspberry Pi gibi uç cihazlarda olağanüstü gerçek zamanlı çıkarım hızları sunar.
  • Çeşitlilik: Standart detect işleminin ötesinde, YOLOv5 örnek segmentasyonunu ve görüntü sınıflandırmasını destekleyerek, çeşitli görüntü işleme görevleri için esnek bir araç haline gelir.

YOLOv5 hakkında daha fazla bilgi edinin

PP-YOLOE+: Paddle Ekosisteminde Yüksek Doğruluk

PP-YOLOE+, Baidu'daki araştırmacılar tarafından geliştirilen PP-YOLO serisinin bir evrimidir. 2022'de piyasaya sürüldü ve PaddleDetection araç setinde amiral gemisi bir model olarak hizmet vermektedir. COCO gibi kıyaslama veri kümelerinde hassasiyetin sınırlarını zorlamak için anchor'suz bir mimari ve gelişmiş eğitim stratejileri benimser.

Yazarlar: PaddlePaddle Yazarları
Kuruluş:Baidu
Tarih: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
Belgeler:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

Mimari ve Özellikler

PP-YOLOE+, bir CSPRepResNet omurgası ve benzersiz bir prototip içermeyen detect başlığı kullanır. Ankrajsız bir detectör olması, ankraj kutularıyla ilgili hiperparametre ayarlamasının karmaşıklığını azaltır. Ortalama Ortalama Hassasiyetin (mAP) en üst düzeye çıkarılmasının birincil hedef olduğu senaryolarda mükemmeldir ve genellikle artan hesaplama karmaşıklığı pahasına karşılaştırılabilir ankraj tabanlı modellere göre biraz daha yüksek puanlar elde eder. Ancak, PaddlePaddle çerçevesine olan bağımlılığı, PyTorch veya TensorFlow üzerinde standartlaşmış ekipler için bir öğrenme eğrisi sunabilir.

PP-YOLOE+ hakkında daha fazla bilgi edinin

Performans Analizi: Metrikler ve Verimlilik

YOLOv5 ve PP-YOLOE+'yı karşılaştırırken, ödünleşme genellikle ham doğruluk ve operasyonel verimlilik (hız ve dağıtım kolaylığı) arasında yatar.

Hız - Doğruluk Dengesi

PP-YOLOE+ modelleri genellikle daha yüksek mAP değerleri yayınlarval COCO veri kümesindeki skorları, saf detect yeteneklerindeki güçlerini gösteriyor. Örneğin, PP-YOLOE+l dikkat çekici bir 52.9 mAP değerine ulaşıyor. Ancak bu, genellikle YOLOv5'e kıyasla standart donanımda daha yüksek gecikmeyle birlikte gelir.

Ultralytics YOLOv5 parlıyor Çıkarım hızı. Şunu YOLOv5n (Nano) modeli inanılmaz derecede hafiftir ve kullanarak bir T4 GPU'da 1,12 ms'lik inanılmaz hızlı bir çıkarım süresiyle 28,0 mAP elde eder. TensorRT. Bu, YOLOv5'i şu alan için üstün bir seçim yapar: uç (edge) AI uygulamaları milisaniye gecikmesinin kritik olduğu yerlerde.

Hesaplama Verimliliği

YOLOv5 modelleri, bellek kısıtlamaları göz önünde bulundurularak tasarlanmıştır. Genellikle karmaşık ankrajsız mimarilere veya transformatör tabanlı modellere kıyasla eğitim ve çıkarım sırasında daha az CUDA belleği gerektirirler. Bu verimlilik, NVIDIA Jetson modülleri gibi kaynak kısıtlı donanımlarda, kapsamlı optimizasyon çabalarına gerek kalmadan daha sorunsuz dağıtımı kolaylaştırır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Eğitim Ekosistemi ve Kullanılabilirlik

Geliştirici deneyiminin "yumuşak" metrikleri genellikle bir projenin başarısını belirler. Burada, iki model arasındaki fark en belirgindir.

Ultralytics Ekosistemi

YOLOv5, tüm MLOps hattını kolaylaştıran entegre Ultralytics ekosisteminden yararlanır.

  • PyTorch Yerel: PyTorch üzerine inşa edilmiş olması, açık kaynaklı araçların ve kitaplıkların büyük çoğunluğuyla uyumluluk sağlar.
  • Sorunsuz Entegrasyonlar: Weights & Biases, Comet ve ClearML için yerleşik destek, deney takibini zahmetsiz hale getirir.
  • Eğitim Verimliliği: Önceden eğitilmiş ağırlıklar kolayca bulunur ve otomatik olarak indirilir, bu da hızlı transfer öğrenimine olanak tanır.
  • Dağıtım: Dışa aktarma modu, ONNX, CoreML, TFLite ve daha fazlasına tek tıklamayla dönüştürmeyi destekler.

Ultralytics HUB ile İş Akışını Basitleştirme

Ultralytics HUB kullanarak tek bir kod satırı yazmadan YOLOv5 modellerini eğitebilir, önizleyebilir ve dağıtabilirsiniz. Bu web tabanlı platform, veri kümelerinizi ve eğitim çalıştırmalarınızı yöneterek, vizyon yapay zekasını her beceri düzeyinden ekipler için erişilebilir hale getirir.

PaddlePaddle Ekosistemi

PP-YOLOE+, Baidu'nun derin öğrenme çerçevesi olan PaddlePaddle'a dayanır. Güçlü ve Asya'da popüler olmasına rağmen, PyTorch'e kıyasla Batı araştırma topluluğunda daha küçük bir ayak izine sahiptir. PP-YOLOE+'yi benimsemek genellikle ayrı bir ortam kurmayı ve Paddle'a özgü sözdizimini öğrenmeyi gerektirir (paddle.io, paddle.nn). Sırasıyla belgeleme kapsamlı olmasına rağmen, üçüncü taraf araçların ekosistemi ve topluluk desteği YOLOv5'inkinden daha az kapsamlıdır.

Kod Örneği: YOLOv5'in Basitliği

Aşağıdaki Python kodu, önceden eğitilmiş bir YOLOv5 modelini yüklemenin ve PyTorch Hub kullanılarak çıkarım gerçekleştirmenin ne kadar kolay olduğunu göstermektedir.

import torch

# Load a YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image source
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results to console
results.print()

# Show the image with bounding boxes
results.show()

Gerçek Dünya Kullanım Durumları

YOLOv5'in Üstün Olduğu Alanlar

  • Endüstriyel Otomasyon: Yüksek hızı, hızlı hareket eden montaj hatlarında gerçek zamanlı kusur tespitine olanak tanır.
  • Otonom Robotik: Düşük bellek kullanımı, onu lojistik alanında kullanılanlar gibi sınırlı yerleşik işlem gücüne sahip robotlar için ideal kılar.
  • Akıllı Şehir Uygulamaları: Verimli CPU performansı, mevcut altyapıda trafik izleme için geniş ölçekli dağıtıma olanak tanır.

PP-YOLOE+'nın Uygun Olduğu Yerler

  • Yüksek Hassasiyetli Araştırma: mAP'ın son %1'ini elde etmenin çıkarım hızından daha önemli olduğu akademik projeler.
  • Paddle Merkezli Ortamlar: Zaten Baidu ekosistem altyapısına büyük yatırımlar yapmış olan kurumsal ortamlar.

Sonuç: Sizin İçin Hangi Model Doğru?

Geliştiricilerin ve ticari uygulamaların büyük çoğunluğu için Ultralytics YOLOv5 önerilen seçim olmaya devam ediyor. Eşsiz kullanım kolaylığı, güçlü topluluk desteği ve dağıtım esnekliği, onu düşük riskli, yüksek ödüllü bir çözüm haline getirir. Mobil telefonlardan bulut sunucularına kadar neredeyse her platforma minimum sürtünmeyle dağıtım yapabilme özelliği, üretim ortamlarında belirleyici bir avantaj sağlar.

PP-YOLOE+, özellikle ankrajsız bir mimari gerektiren veya zaten PaddlePaddle iş akışına entegre olmuş kullanıcılar için güçlü bir alternatiftir. Yüksek doğruluğu takdire şayandır, ancak ekosistem parçalanması standart PyTorch iş akışlarına alışkın olanlar için geliştirmeyi yavaşlatabilir.

Diğer Modelleri İnceleyin

Bilgisayarla görme hızla ilerliyor. Bu yerleşik modelleri karşılaştırmak değerli olsa da, daha da yüksek performans ve özellikler sunan Ultralytics YOLO ailesindeki en son gelişmeleri keşfetmenizi öneririz.

  • YOLO11: Detect, segmentasyon ve poz tahmini için üstün doğruluk ve verimlilik sunan en son teknoloji ürünü model.
  • YOLOv8: OBB ve sınıflandırma görevlerini destekleyen oldukça popüler bir birleşik çerçeve.
  • RT-DETR: Gerçek zamanlı performans için optimize edilmiş, dönüştürücü tabanlı bir dedektör.

Daha geniş bir görünüm için, belirli gereksinimlerinize göre farklı mimarileri karşılaştırmak üzere ana model karşılaştırma sayfamıza göz atın.


Yorumlar