PP-YOLOE+ vs YOLOv5: Yüksek Doğrulukta Tespit ve Üretime Hazırlık
En uygun nesne algılama modelinin seçilmesi genellikle ham akademik ölçütler ile pratik dağıtım yetenekleri arasında bir denge kurulmasını gerektirir. Bu teknik karşılaştırma, PaddlePaddle ekosisteminden gelişmiş bir çapasız dedektör olan PP-YOLOE+ ve Ultralytics YOLOv5Hız, doğruluk ve kullanım kolaylığı dengesiyle tanınan endüstri standardı model. PP-YOLOE+ Ortalama Ortalama HassasiyetinmAP) sınırlarını zorlarken, YOLOv5 benzersiz geliştirici deneyimi ve dağıtım çok yönlülüğü nedeniyle gerçek zamanlı çıkarım uygulamalarında baskın bir güç olmaya devam etmektedir.
PP-YOLOE+: PaddlePaddle'da Hassas Mühendislik
PP-YOLOE+, PaddleDetection paketinin bir parçası olarak Baidu 'daki araştırmacılar tarafından geliştirilen PP-YOLOE'nin yükseltilmiş bir sürümüdür. Yüksek hassasiyetli görevlere odaklanan verimli, son teknoloji ürünü bir endüstriyel nesne dedektörü olarak tasarlanmıştır. Çapa içermeyen bir mimariden yararlanarak, eğitim hattını basitleştirir ve genellikle çapa tabanlı yöntemlerle ilişkili hiperparametre ayarını azaltır.
Yazarlar PaddlePaddle Yazarlar
Organizasyon: Baidu
Tarih: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: PaddlePaddle
Dokümanlar: https:PaddlePaddle
Mimarlık ve İnovasyon
PP-YOLOE+ mimarisi, özellik temsilini ve yerelleştirmeyi iyileştirmek için çeşitli gelişmiş mekanizmalar sunar:
- Backbone: Çapraz Aşamalı Kısmi (CSP) ağların gradyan akışı avantajlarını RepVGG'nin yeniden parametrelendirme teknikleriyle birleştiren bir backbone olan CSPRepResNet'i kullanır.
- Çapasız Başlık: Sınıflandırma ve regresyon görevlerini ayırmak için Verimli Görev Hizalamalı Başlık (ET-Head) kullanılır ve yakınsama hızını ve doğruluğunu artırır.
- Eğitim Stratejisi: Pozitif örnekleri dinamik olarak atamak için Görev Hizalama Öğrenimini (TAL) içerir ve eğitim sırasında en yüksek kaliteli tahminlere öncelik verilmesini sağlar.
- Kayıp Fonksiyonları: Sınıf dengesizliğini gidermek ve sınırlayıcı kutu hassasiyetini iyileştirmek için VariFocal Loss (VFL) ve Distribution Focal Loss (DFL) kullanır.
Güçlü ve Zayıf Yönler
PP-YOLOE+, maksimum doğruluğun kritik olduğu senaryolarda üstünlük sağlar. Çapa içermeyen tasarımı, çapa kutularını kümeleme ihtiyacını ortadan kaldırarak farklı nesne şekillerine sahip veri kümelerine uyarlanabilir hale getirir. Bununla birlikte, bu durumun PaddlePaddle çerçevesi, standartlaştırılmış ekipler için bir engel olabilir PyTorch veya TensorFlow. Modelleri dönüştürmek için araçlar mevcut olsa da, yerel ekosistem desteği, daha evrensel olarak benimsenen çerçevelere göre daha az kapsamlıdır.
Ekosistemle İlgili Hususlar
PP-YOLOE+ etkileyici bir teorik performans sunarken, benimsenmesi genellikle PaddlePaddle'ın standart PyTorch iş akışlarından önemli ölçüde farklılık gösterebilen özel sözdizimi ve dağıtım araçlarına aşina olmayı gerektirir.
PP-YOLOE+ hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Görsel Yapay Zeka için Küresel Standart
Glenn Jocher tarafından 2020 yılında yayınlandı, Ultralytics YOLOv5 son teknoloji nesne algılamayı tüm beceri seviyelerindeki geliştiriciler için erişilebilir hale getirerek bilgisayarla görmenin manzarasını temelden değiştirdi. PyTorch'ta yerel olarak inşa edilen YOLOv5 , "eğitim verimliliği" ve "kullanım kolaylığı" üzerine odaklanarak veri kümesi küratörlüğünden üretim dağıtımına kadar sorunsuz bir yol sağlar.
Yazarlar: Glenn Jocher
Organizasyon: Ultralytics
Tarih: 2020-06-26
GitHub: yolov5
Dokümanlar: https:yolov5
Mimari ve Temel Özellikler
YOLOv5 , verimi en üst düzeye çıkarmak için derinlik ve genişliği dengeleyen son derece optimize edilmiş çapa tabanlı bir mimari kullanır:
- CSPDarknet Backbone: Çapraz Aşamalı Kısmi ağ tasarımı, gereksiz gradyan bilgilerini en aza indirerek parametreleri azaltırken öğrenme kapasitesini artırır.
- PANet Boyun: Bir Yol Toplama Ağı (PANet) bilgi akışını iyileştirerek modelin nesneleri farklı ölçeklerde doğru bir şekilde konumlandırmasına yardımcı olur.
- Mozaik Büyütme: Dört eğitim görüntüsünü tek bir görüntüde birleştirerek modelin küçük nesneleri detect etme ve yeni ortamlara genelleme yeteneğini önemli ölçüde artıran gelişmiş bir veri büyütme tekniği.
- Genetik Algoritmalar: Otomatik hiperparametre evrimi, modelin özel veri kümelerinde optimum performans için kendi kendini ayarlamasına olanak tanır.
Güçlü Yönler ve Ekosistem
YOLOv5 , Kullanım Kolaylığı ile ünlüdür. API sezgiseldir ve kullanıcıların sadece birkaç satır Python koduyla bir model yüklemelerine ve çıkarım yapmalarına olanak tanır.
import torch
# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Print results
results.print()
Kodun ötesinde, Bakımlı Ekosistem YOLOv5 'i diğerlerinden ayırır. Kullanıcılar sık güncellemelerden, büyük bir topluluk forumundan ve Comet ve ClearML gibi MLOps araçlarıyla sorunsuz entegrasyonlardan yararlanır. Modelin Çok Yönlülüğü, basit algılamanın ötesine geçerek örnek segmentasyonu ve görüntü sınıflandırma görevlerini aynı çerçeve içinde destekler. Ayrıca, YOLOv5 modelleri genellikle eğitim sırasında transformatör tabanlı mimarilere kıyasla daha düşük bellek gereksinimleri sergiler ve bu da onları tüketici sınıfı GPU'larda erişilebilir hale getirir.
YOLOv5 hakkında daha fazla bilgi edinin
Teknik Performans Karşılaştırması
İki modeli karşılaştırırken, mAP gibi standart doğruluk ölçütlerinin yanı sıra çıkarım hızı ve parametre sayısı gibi gerçek dünyadaki faydayı etkileyen ölçütlere de bakmak önemlidir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Sonuçların Analizi
- Doğruluk ve Hız: PP-YOLOE+, özellikle daha büyük varyantlarda (l ve x), çapasız kafa ve TAL stratejisinden yararlanarak daha yüksek mAP skorları göstermektedir. Bununla birlikte, YOLOv5 üstün bir Performans Dengesi sunmakta ve önemli ölçüde daha düşük gecikme süresiyle oldukça rekabetçi doğruluk sağlamaktadır (bkz. TensorRT hızları). Bu, YOLOv5 'i özellikle her milisaniyenin önemli olduğu uç yapay zeka uygulamaları için çok uygun hale getirir.
- Kaynak Verimliliği: YOLOv5n (Nano) sadece 2,6M parametre ile son derece hafiftir, bu da onu mobil ve IoT cihazları için ideal hale getirir. PP-YOLOE+ verimli omurgalara sahip olsa da, mimari karmaşıklık YOLOv5'in aerodinamik tasarımına kıyasla eğitim sırasında daha yüksek bellek kullanımına yol açabilir.
- Eğitim Verimliliği: YOLOv5 , başlangıçtan itibaren performansı en üst düzeye çıkarmak için AutoAnchor ve hiperparametre evrimini kullanır. Yüksek kaliteli önceden eğitilmiş ağırlıkların mevcudiyeti, hızlı transfer öğrenimine olanak tanıyarak geliştirme süresini önemli ölçüde kısaltır.
Gerçek Dünya Kullanım Durumları
Bu modeller arasındaki seçim genellikle belirli dağıtım ortamına bağlıdır.
PP-YOLOE+ Uygulamaları
PP-YOLOE+, özellikle Baidu'nun altyapısının yaygın olduğu Asya pazarında akademik araştırmalarda ve endüstriyel senaryolarda sıklıkla tercih edilmektedir.
- Otomatik Hata Tespiti: Yüksek hassasiyet, üretim hatlarındaki küçük çiziklerin belirlenmesine yardımcı olur.
- Trafik Gözetimi: Yoğun trafik akışında benzer araç türlerini ayırt edebilir.
YOLOv5 Uygulamaları
YOLOv5'in çok yönlülüğü, onu geniş bir küresel endüstri yelpazesi için başvurulacak bir çözüm haline getirmektedir.
- Akıllı Tarım: Uç cihazlardaki hızı nedeniyle gerçek zamanlı ürün sağlığı izleme ve meyve toplama robotları için kullanılır.
- Perakende Analitiği: Mağaza-sunucu donanımında verimli bir şekilde çalışan nesne sayımı ve envanter yönetimi için sistemlere güç verir.
- Otonom Robotik: Düşük gecikme süresi, dronların ve robotların karmaşık ortamlarda güvenli bir şekilde gezinmesini sağlar.
- Güvenlik Sistemleri: İzinsiz giriş tespiti için güvenlik alarm sistemlerine kolayca entegre olur.
Dağıtım Esnekliği
YOLOv5 , ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere çok sayıda formata sorunsuz bir şekilde export modunda çalışabilir. Bu, bir model eğitildikten sonra iPhone'dan bulut sunucusuna kadar neredeyse her yere dağıtılabilmesini sağlar.
Sonuç
PP-YOLOE+, COCO gibi ölçütlerde etkileyici bir doğrulukla çapasız tespitte önemli bir başarıyı temsil ederken, Ultralytics YOLOv5 çoğu geliştirici ve ticari uygulama için üstün bir seçim olmaya devam etmektedir. Kullanım Kolaylığı, sağlam ve bakımlı bir Ekosistem ve mükemmel Performans Dengesinin kazanan kombinasyonu, projelerin konseptten üretime hızlı ve güvenilir bir şekilde geçmesini sağlar.
Ultralytics , bilgisayarla görme teknolojisinde mutlak en son teknolojiyi arayan kullanıcılar için ayrıca şunları sunar YOLO11YOLOv5 'in mirasına dayanarak algılama, segmentasyon ve poz tahmini görevlerinde daha da fazla verimlilik ve kabiliyet sağlar.
Daha Fazlasını Keşfedin
Gelişmiş performans özellikleri sunan modern alternatifleri keşfetmek için aşağıdakileri gözden geçirmeyi düşünün:
- Ultralytics YOLO11: Üstün doğruluk ve hız sunan en son teknoloji ürünü model.
- Ultralytics YOLOv8: Algılama, segmentasyon ve sınıflandırma için birleşik çerçeveler sunan çok yönlü bir model.
- RT-DETR: Yüksek doğruluk gereksinimleri için gerçek zamanlı transformatör tabanlı bir dedektör.
Bir sonraki projenizde kullanabileceğiniz tüm yapay zeka çözümlerini görmek için Modeller sayfamızı ziyaret edin.