PP-YOLOE+ - YOLOv5: Yüksek Doğruluklu Algılama ve Üretim Hazırlığı Arasında Gezinme
Optimum nesne algılama modelini seçmek genellikle ham akademik metrikler ve pratik dağıtım yetenekleri arasında bir ödünleşim içerir. Bu teknik karşılaştırma, PaddlePaddle ekosisteminden gelişmiş bir anchor-free detectör olan PP-YOLOE+ ile hız, doğruluk ve kullanım kolaylığı dengesiyle ünlü endüstri standardı model olan Ultralytics YOLOv5'i inceler. PP-YOLOE+ ortalama Kesinlik (mAP) sınırlarını zorlarken, YOLOv5 benzersiz geliştirici deneyimi ve dağıtım çok yönlülüğü nedeniyle gerçek zamanlı çıkarım uygulamalarında baskın bir güç olmaya devam ediyor.
PP-YOLOE+: PaddlePaddle'da Hassas Mühendislik
PP-YOLOE+, PaddleDetection paketinin bir parçası olarak Baidu'daki araştırmacılar tarafından geliştirilen PP-YOLOE'nin yükseltilmiş bir sürümüdür. Yüksek hassasiyetli görevlere odaklanan, verimli, son teknoloji ürünü bir endüstriyel nesne detectörü olacak şekilde tasarlanmıştır. Bir anchor'suz mimariden yararlanarak, eğitim hattını basitleştirir ve genellikle anchor tabanlı yöntemlerle ilişkili hiperparametre ayarlamasını azaltır.
Yazarlar: PaddlePaddle Yazarları
Kuruluş: Baidu
Tarih: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
Belgeler: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Mimari ve İnovasyon
PP-YOLOE+'nın mimarisi, özellik gösterimini ve yerelleştirmeyi iyileştirmek için çeşitli gelişmiş mekanizmalar sunar:
- Backbone: Çapraz Aşamalı Kısmi (CSP) ağlarının gradyan akışı faydalarını RepVGG'nin yeniden parametrelendirme teknikleriyle birleştiren bir backbone olan CSPRepResNet'i kullanır.
- Çapa Olmayan Başlık: Verimli Görev Uyumlu Bir Başlık (ET-Head), sınıflandırma ve regresyon görevlerini ayırmak, yakınsama hızını ve doğruluğunu artırmak için kullanılır.
- Eğitim Stratejisi: Pozitif örnekleri dinamik olarak atamak için Görev Hizalama Öğrenimi'ni (TAL) içerir ve eğitim sırasında en yüksek kaliteli tahminlerin önceliklendirilmesini sağlar.
- Kayıp Fonksiyonları: Sınıf dengesizliğini gidermek ve sınırlayıcı kutu hassasiyetini artırmak için VariFocal Kaybı (VFL) ve Dağıtım Odaklı Kaybı (DFL) kullanır.
Güçlü ve Zayıf Yönler
PP-YOLOE+, maksimum doğruluğun kritik olduğu senaryolarda mükemmeldir. Anchor-free tasarımı, anchor boxları kümeleme ihtiyacını ortadan kaldırarak, onu değişen nesne şekillerine sahip veri kümelerine uyarlanabilir hale getirir. Bununla birlikte, PaddlePaddle çerçevesine olan ağır bağımlılığı, PyTorch veya TensorFlow üzerinde standartlaştırılmış ekipler için bir engel olabilir. Modelleri dönüştürmek için araçlar mevcut olsa da, yerel ekosistem desteği, daha evrensel olarak benimsenen çerçevelere göre daha az kapsamlıdır.
Ekosistem Değerlendirmeleri
PP-YOLOE+ etkileyici teorik performans sunsa da, benimsenmesi genellikle PaddlePaddle'ın belirli sözdizimi ve dağıtım araçlarına aşinalık gerektirir ve bu da standart PyTorch iş akışlarından önemli ölçüde farklı olabilir.
PP-YOLOE+ hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Görüntü İşleme Yapay Zekası için Küresel Standart
Glenn Jocher tarafından 2020'de yayınlanan Ultralytics YOLOv5, son teknoloji nesne algılamayı her beceri düzeyinden geliştiricinin erişimine sunarak bilgisayar görüşü alanında temelden bir değişiklik yaptı. Yerel olarak PyTorch'ta oluşturulan YOLOv5, veri kümesi düzenlemesinden üretime dağıtıma kadar sorunsuz bir yol sağlayarak "eğitim verimliliğine" ve "kullanım kolaylığına" odaklanır.
Yazarlar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeler: https://docs.ultralytics.com/models/yolov5/
Mimari ve Temel Özellikler
YOLOv5, verimi en üst düzeye çıkarmak için derinliği ve genişliği dengeleyen, yüksek oranda optimize edilmiş, bağlantı tabanlı bir mimari kullanır:
- CSPDarknet Omurgası: Cross Stage Partial ağ tasarımı, yedekli gradyan bilgisini en aza indirerek öğrenme yeteneğini geliştirirken parametreleri azaltır.
- PANet Katmanı: Bir Yol Toplama Ağı (PANet), bilgi akışını iyileştirerek modelin nesneleri farklı ölçeklerde doğru bir şekilde lokalize etmesine yardımcı olur.
- Mozaik Artırma: Dört eğitim görüntüsünü bir araya getiren ve modelin küçük nesneleri algılama ve yeni ortamlara genelleme yeteneğini önemli ölçüde geliştiren gelişmiş bir veri artırma tekniğidir.
- Genetik Algoritmalar: Otomatik hiperparametre evrimi, modelin özel veri kümelerinde optimum performans için kendini ayarlamasını sağlar.
Güçlü Yönler ve Ekosistem
YOLOv5, Kullanım Kolaylığı ile kutlanır. API sezgiseldir ve kullanıcıların yalnızca birkaç satır Python koduyla bir modeli yüklemesine ve çıkarım çalıştırmasına olanak tanır.
import torch
# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Print results
results.print()
Kodun ötesinde, İyi Yönetilen Ekosistem YOLOv5'i farklı kılar. Kullanıcılar sık güncellemelerden, büyük bir topluluk forumundan ve Comet ve ClearML gibi MLOps araçlarıyla sorunsuz entegrasyonlardan yararlanır. Modelin Çok Yönlülüğü, aynı çerçevede nesne bölütleme ve görüntü sınıflandırma görevlerini destekleyerek basit detect ötesine geçer. Ayrıca, YOLOv5 modelleri genellikle transformer tabanlı mimarilere kıyasla eğitim sırasında daha düşük bellek gereksinimleri gösterir ve bu da onları tüketici sınıfı GPU'larda erişilebilir kılar.
YOLOv5 hakkında daha fazla bilgi edinin
Teknik Performans Karşılaştırması
İki modeli karşılaştırırken, mAP gibi standart doğruluk metriklerinin yanı sıra çıkarım hızı ve parametre sayısı gibi gerçek dünya kullanışlılığını etkileyen metriklere bakmak önemlidir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Sonuçların Analizi
- Doğruluk - Hız: PP-YOLOE+, özellikle daha büyük varyantlarda (l ve x), ankraj içermeyen başlığı ve TAL stratejisinden yararlanarak daha yüksek mAP puanları gösterir. Bununla birlikte, YOLOv5, önemli ölçüde daha düşük gecikmeyle (TensorRT hızlarına bakın) yüksek rekabetçi doğruluk sunarak üstün bir Performans Dengesi sunar. Bu, YOLOv5'i her milisaniyenin önemli olduğu uç yapay zeka uygulamaları için özellikle uygun hale getirir.
- Kaynak Verimliliği: YOLOv5n (Nano), yalnızca 2,6M parametre ile son derece hafiftir ve bu da onu mobil ve IoT cihazları için ideal hale getirir. PP-YOLOE+'nin verimli backbone'ları olmasına rağmen, mimari karmaşıklık, YOLOv5'in aerodinamik tasarımına kıyasla eğitim sırasında daha yüksek bellek kullanımına yol açabilir.
- Eğitim Verimliliği: YOLOv5, başlangıçtan itibaren performansı en üst düzeye çıkarmak için AutoAnchor ve hiperparametre evrimini kullanır. Yüksek kaliteli önceden eğitilmiş ağırlıkların mevcudiyeti, hızlı transfer öğrenimine olanak tanıyarak geliştirme süresini önemli ölçüde kısaltır.
Gerçek Dünya Kullanım Durumları
Bu modeller arasındaki seçim genellikle özel dağıtım ortamına bağlıdır.
PP-YOLOE+ Uygulamaları
PP-YOLOE+, özellikle Baidu'nun altyapısının yaygın olduğu Asya pazarında akademik araştırmalarda ve endüstriyel senaryolarda sıklıkla tercih edilmektedir.
- Otomatik Kusur Tespiti: Yüksek hassasiyet, üretim hatlarındaki küçük çizikleri tanımlamaya yardımcı olur.
- Trafik Gözetimi: Yoğun trafik akışında benzer araç türleri arasında ayrım yapabilir.
YOLOv5 Uygulamaları
YOLOv5'in çok yönlülüğü, onu geniş bir küresel endüstri yelpazesi için başvurulacak çözüm haline getiriyor.
- Akıllı Tarım: Kenar cihazlarındaki hızı nedeniyle gerçek zamanlı ürün sağlığı izleme ve meyve toplama robotları için kullanılır.
- Perakende Analitiği:Nesne sayımı ve envanter yönetimi için sistemlere güç sağlar ve mağaza sunucu donanımında verimli bir şekilde çalışır.
- Otonom Robotik: Düşük gecikme süresi, dronların ve robotların karmaşık ortamlarda güvenli bir şekilde gezinmesini sağlar.
- Güvenlik Sistemleri: İzinsiz giriş tespiti için güvenlik alarm sistemlerine kolayca entegre olur.
Dağıtım Esnekliği
YOLOv5, ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere çok sayıda formata sorunsuz bir şekilde aktarılır. export modu. Bu, bir model eğitildikten sonra, bir iPhone'dan bir bulut sunucusuna kadar neredeyse her yerde dağıtılabileceğini garanti eder.
Sonuç
PP-YOLOE+, COCO gibi kıyaslamalarda etkileyici doğrulukla ankrajsız tespitte önemli bir başarıyı temsil etse de, Ultralytics YOLOv5 çoğu geliştirici ve ticari uygulama için üstün bir seçim olmaya devam ediyor. Kullanım Kolaylığı, sağlam İyi Yönetilen Ekosistem ve mükemmel Performans Dengesi kombinasyonu, projelerin kavramdan üretime hızla ve güvenilir bir şekilde geçmesini sağlar.
Bilgisayar görüşü teknolojisindeki en son gelişmeleri arayan kullanıcılar için Ultralytics, algılama, segmentasyon ve poz tahmini görevlerinde daha da yüksek verimlilik ve yetenekle YOLOv5'in mirasını temel alan YOLO11'i de sunmaktadır.
Daha Fazlasını Keşfedin
Gelişmiş performans özellikleri sunan modern alternatifleri keşfetmek için aşağıdakileri incelemeyi düşünebilirsiniz:
- Ultralytics YOLO11: En son teknoloji ürünü olan bu model, en üstün doğruluk ve hızı sunar.
- Ultralytics YOLOv8: Algılama, segmentasyon ve sınıflandırma için birleşik çerçeveler sunan çok yönlü bir model.
- RT-DETR: Yüksek doğruluk gereksinimleri için gerçek zamanlı, dönüştürücü tabanlı bir dedektör.
Bir sonraki projeniz için mevcut olan tüm vizyon yapay zeka çözümlerini görmek için Modeller sayfamızı ziyaret edin.