İçeriğe geç

YOLOv9 vs. PP-YOLOE+: Teknik Bir Karşılaştırma

Optimum nesne algılama mimarisini seçmek, bilgisayarla görme mühendisleri için çok önemli bir karardır ve yüksek hassasiyet ihtiyacını hesaplama kısıtlamalarıyla dengeler. Bu kapsamlı kılavuz, aşağıdakileri karşılaştırmaktadır YOLOv9yeni gradyan bilgisi teknikleri sunan son teknoloji ürünü bir model ve PaddlePaddle çerçevesi için optimize edilmiş sağlam bir dedektör olan PP-YOLOE+. Bilgisayarla görme uygulamalarınız için en uygun olanı belirlemenize yardımcı olmak için mimari yeniliklerini, kıyaslama performanslarını ve dağıtım uygunluklarını analiz ediyoruz.

YOLOv9: Geliştirilmiş Öğrenme için Programlanabilir Gradyan Bilgisi

YOLOv9 gerçek zamanlı nesne dedektörlerinin evriminde önemli bir sıçramayı temsil ediyor. 2024 yılının başlarında piyasaya sürülen bu sistem, derin sinir ağlarındaki bilgi kaybıyla ilgili temel sorunları ele alarak doğruluk ve parametre verimliliği açısından yeni ölçütler belirliyor.

Yazarlar Chien-Yao Wang ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Dokümantasyon:ultralytics

Mimari, çığır açan iki kavramı tanıtmaktadır: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). Ağlar derinleştikçe, kayıp fonksiyonunu hesaplamak için gerekli olan veriler kaybolabilir; bu da bilgi darboğazı olarak bilinen bir olgudur. PGI, yardımcı bir tersine çevrilebilir dal aracılığıyla güvenilir gradyanlar üreterek bu sorunu çözer ve derin özelliklerin kritik bilgileri korumasını sağlar. Aynı zamanda GELAN, parametre kullanımını optimize ederek modelin derinlemesine konvolüsyon tabanlı mimarilere kıyasla daha az hesaplama kaynağıyla daha üstün doğruluk elde etmesini sağlar.

Ultralytics ekosistemine entegre olan YOLOv9 , karmaşık iş akışlarını basitleştiren kullanıcı merkezli bir tasarımdan yararlanır. Geliştiriciler, eğitim, doğrulama ve dağıtım için birleşik bir Python API 'sinden yararlanarak prototipten üretime kadar geçen süreyi önemli ölçüde azaltabilir. Bu entegrasyon aynı zamanda çok çeşitli veri kümeleri ve dışa aktarma formatlarıyla uyumluluk sağlar.

YOLOv9 hakkında daha fazla bilgi edinin

PP-YOLOE+: PaddlePaddle Ekosistemi İçinde Yüksek Doğruluk

PP-YOLOE+, PaddleDetection paketinin bir parçası olarak Baidu tarafından geliştirilen PP-YOLOE'nin gelişmiş bir sürümüdür. Üzerinde verimli çalışacak şekilde özel olarak tasarlanmıştır. PaddlePaddle çerçeve, endüstriyel uygulamalar için güçlü bir hız ve hassasiyet dengesi sunar.

Yazarlar: PaddlePaddle Yazarlar
Organizasyon:Baidu
Tarih: 2022-04-02
ArxivPaddlePaddle
GitHubPaddlePaddle
DokümantasyonPaddlePaddlePaddlePaddle

PP-YOLOE+, hiperparametre ayarlama sürecini basitleştiren önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldıran çapasız bir mekanizma kullanır. backbone tipik olarak CSPRepResNet kullanır ve Görev Hizalama Öğrenimi (TAL) tarafından desteklenen benzersiz bir kafa tasarımına sahiptir. Bu yaklaşım, tespit sonuçlarının kalitesini artırmak için sınıflandırma ve yerelleştirme görevlerini hizalar. PP-YOLOE+ son derece yetenekli olmakla birlikte, PaddlePaddle ekosistemi ile sıkı bir şekilde bağlantılıdır ve bu da standartlaştırılmış ekipler için bir öğrenme eğrisi sunabilir PyTorch veya TensorFlow.

Ekosistem Bağımlılığı

PP-YOLOE+ rekabetçi bir performans sunarken, PaddlePaddle çerçevesine olan bağımlılığı, Batı araştırma topluluğunda yaygın olarak kullanılan daha geniş PyTorch araçlar ve kütüphanelerle birlikte çalışabilirliği sınırlayabilir.

PP-YOLOE+ hakkında daha fazla bilgi edinin

Performans Analizi: Hız, Doğruluk ve Verimlilik

Bu iki mimariyi karşılaştırırken, YOLOv9 hem parametre verimliliğinde hem de en yüksek doğrulukta açık bir avantaj göstermektedir. GELAN entegrasyonu, YOLOv9 'un görsel verileri daha etkili bir şekilde işlemesine olanak tanıyarak COCO veri setinde daha yüksek Ortalama Hassasiyet (mAP ) skorları elde edilmesini sağlarken genellikle daha düşük gecikme süresini de korur.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Temel Çıkarımlar

  • Parametre Verimliliği: YOLOv9 modeli, sadece 2,0 milyon parametre kullanırken daha büyük modellerle karşılaştırılabilir performans elde eder, bu da 4,85 milyonluk PP-YOLOE+t varyantından önemli ölçüde daha azdır. Bu, YOLOv9 'u özellikle sınırlı depolama alanına sahip uç yapay zeka cihazları için uygun hale getirir.
  • En Yüksek Doğruluk:YOLOv9, yaklaşık %40 daha az parametre (57,3M'ye karşı 98,42M) kullanmasına rağmen en büyük PP-YOLOE+x modelini (%54,7 mAP) geride bırakarak %55,6'lık kayda değer bir mAP elde etmiştir. Bu, GELAN'ın özellik çıkarma yeteneklerini en üst düzeye çıkarmadaki mimari üstünlüğünü vurgulamaktadır.
  • Çıkarım Hızı: PP-YOLOE+s, T4 GPU'larda ham gecikme süresinde hafif bir üstünlük gösterirken, YOLOv9 modelleri genellikle benzer hesaplama maliyetleri için önemli ölçüde daha yüksek doğruluk sağlayarak daha iyi bir denge sunar. Örneğin, YOLOv9 daha hızlı (7,16 ms vs 8,36 ms) ve daha hafif olmasına rağmen PP-YOLOE+l'den doğrulukta (%53,0 vs %52,9) daha iyi performans gösterir.

Eğitim Metodolojisi ve Kullanım Kolaylığı

Geliştirici deneyimi iki model arasında önemli ölçüde farklılık göstermekte olup, bunun başlıca nedeni temel çerçeveler ve ekosistem desteğidir.

Ultralytics Ekosistem Avantajı

Seçme YOLOv9Ultralytics aracılığıyla, makine öğrenimi yaşam döngüsünü kolaylaştırmak için tasarlanmış kapsamlı bir araç paketine erişim sağlar.

  • Basit API: Bir modeli eğitmek için yalnızca birkaç satır kod gerekir ve bu sayede karmaşık ayrıntılar soyutlanır.
  • Bellek Verimliliği: Ultralytics YOLO modelleri, transformatör tabanlı mimarilere kıyasla eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir ve tüketici sınıfı donanımlarda daha büyük parti boyutlarına izin verir.
  • Çok yönlülük: Algılamanın ötesinde, Ultralytics çerçevesi örnek segmentasyonunu, poz tahminini ve sınıflandırmayı destekleyerek çeşitli görevler için birleşik bir arayüz sunar.
  • Verimli Eğitim: Gelişmiş veri artırımı ve önceden eğitilmiş ağırlıkların hazır olması sayesinde geliştiriciler daha hızlı yakınsama elde ederek değerli GPU saatlerinden tasarruf edebilir.

Ultralytics ile Kolaylaştırılmış İş Akışı

Otomatik hiperparametre ayarı ve deney takibi için sağlam Ultralytics motorundan yararlanarak, sadece birkaç satır Python ile bir YOLOv9 modelini yükleyebilir, eğitebilir ve doğrulayabilirsiniz.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

PaddlePaddle Çevre

PP-YOLOE+, PaddleDetection kütüphanesini gerektirir. Güçlü olsa da Baidu ekosistemine aşina olmayı gerektirir. Ortamı kurmak, veri kümelerini gerekli formata dönüştürmek ve dağıtım için modelleri dışa aktarmak, PaddlePaddle altyapısına zaten dahil olmayan kullanıcılar için daha karmaşık olabilir.

İdeal Kullanım Senaryoları

Her modelin güçlü yönlerinin anlaşılması, belirli gerçek dünya uygulamaları için doğru aracın seçilmesine yardımcı olur.

YOLOv9 Ne Zaman Seçilmeli

  • Otonom Sistemler: Doğruluğu en üst düzeye çıkarmanın güvenlik açısından kritik olduğu sürücüsüz araçlar ve robotik için YOLOv9'nin üstün mAP 'si gerekli güvenilirliği sağlar.
  • Uçta Dağıtım: Hafif YOLOv9, insan sayma veya akıllı perakende analizi gibi görevler için Raspberry Pi veya NVIDIA Jetson cihazlarına yerleştirmek için mükemmeldir.
  • Araştırma ve Geliştirme: Bakımlı ekosistem ve PyTorch desteği, yeni bilgisayarla görme çözümlerinin prototipini oluşturan veya nesne izleme yeteneklerini entegre eden araştırmacılar için idealdir.
  • Kaynak Kısıtlı Ortamlar: Sınırlı VRAM ile yüksek performans gerektiren uygulamalar, YOLOv9'un verimli mimarisinden ve daha düşük bellek ayak izinden yararlanır.

PP-YOLOE+ Ne Zaman Seçilmeli

  • PaddlePaddle Kullanıcıları: Halihazırda Baidu'nun altyapısını kullanan kuruluşlar için PP-YOLOE+ sorunsuz entegrasyon ve yerel optimizasyon sunar.
  • Endüstriyel Denetim (Çin): Asya pazarında güçlü bir şekilde benimsenmesi nedeniyle, genellikle belirli Paddle çıkarım donanımına dayanan üretim hatlarında bulunur.

Sonuç

Her iki model de nesne algılama alanında zorlu rakiplerdir, YOLOv9 küresel geliştiricilerin ve işletmelerin çoğunluğu için üstün bir seçim olarak ortaya çıkmaktadır. Programlanabilir Gradyan Bilgisinin (PGI) yenilikçi kullanımı, önemli ölçüde daha az parametre kullanırken temel ölçümlerde PP-YOLOE+'dan daha iyi performans göstererek olağanüstü verimlilikle son teknoloji ürünü doğruluk sağlar.

Ayrıca Ultralytics ekosistemi, benzersiz kullanım kolaylığı, kapsamlı dokümantasyon ve canlı bir topluluk sağlayarak YOLOv9 'u yükseltir. İster güvenlik alarm sistemleri kuruyor, ister tıbbi görüntüleri analiz ediyor veya akıllı şehir altyapısı geliştiriyor olun, YOLOv9 başarılı olmak için gereken performans dengesini ve çok yönlülüğü sunar.

Dikkate Alınması Gereken Diğer Modeller

Son teknoloji görsel yapay zekayı keşfediyorsanız, Ultralytics'in bu diğer güçlü modellerini göz önünde bulundurun:

  • YOLO11: YOLO serisinin en son evrimi, son teknoloji uygulamalar için daha da yüksek hızlar ve daha yüksek hassasiyet sunar.
  • YOLOv8: Algılama, segmentasyon, poz ve OBB görevlerini destekleyen çok yönlü bir endüstri standardı.
  • RT-DETR: CNN tabanlı mimarilere bir alternatif sunan, doğrulukta üstün olan gerçek zamanlı transformatör tabanlı bir dedektör.

Yorumlar