İçeriğe geç

PP-YOLOE+ vs. YOLOv9: Teknik Bir Karşılaştırma

Bilgisayarla görme projeleri için en uygun mimariyi seçmek, hızla gelişen modellerden oluşan bir ortamda gezinmeyi gerektirir. Bu sayfada Baidu'nun PP-YOLOE+ ve YOLOv9iki sofistike tek aşamalı nesne dedektörü. Bilinçli bir karar vermenize yardımcı olmak için mimari yeniliklerini, performans ölçümlerini ve ekosistem entegrasyonunu analiz ediyoruz. Her iki model de yüksek yetenekler sergilerken, farklı tasarım felsefelerini ve çerçeve bağımlılıklarını temsil etmektedir.

PP-YOLOE+: PaddlePaddle Ekosistemi İçinde Yüksek Doğruluk

PP-YOLOE+, PaddleDetection paketinin bir parçası olarak Baidu tarafından geliştirilen PP-YOLOE'nin gelişmiş bir sürümüdür. Hassasiyet ve çıkarım hızı arasında dengeli bir denge sağlamak üzere tasarlanmış olup, özellikle aşağıdakiler için optimize edilmiştir PaddlePaddle derin öğrenme çerçevesi.

Yazarlar: PaddlePaddle Yazarlar
Organizasyon:Baidu
Tarih: 2022-04-02
ArxivPaddlePaddle
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
Dokümanlar:PaddleDetection PP-YOLOE+ README

Mimari ve Temel Özellikler

PP-YOLOE+ çapasız, tek aşamalı bir dedektör olarak çalışır. CSPRepResNet backbone üzerine kuruludur ve sınıflandırma ile yerelleştirme görevleri arasındaki hizalamayı iyileştirmek için bir Görev Hizalama Öğrenme (TAL) stratejisi kullanır. Önemli bir özellik, doğruluğu korurken hesaplama ek yükünü azaltan Verimli Görev Hizalamalı Başlıktır (ET-Head). Model, eğitim sırasında sınıf dengesizliğini ele almak için bir Değişken Odaklı Kayıp işlevi kullanır.

Güçlü ve Zayıf Yönler

PP-YOLOE+'nun birincil gücü, Baidu'nun donanım ve yazılım yığını için yaptığı optimizasyonda yatmaktadır. Standart nesne algılama kıyaslamalarında iyi performans gösteren ölçeklenebilir modeller (s, m, l, x) sunar.

Bununla birlikte, PaddlePaddle ekosistemine olan yoğun bağımlılığı, büyük ölçüde PaddlePaddle 'ı tercih eden daha geniş yapay zeka topluluğu için önemli bir engel teşkil etmektedir. PyTorch. Mevcut PyTorch iş akışlarını PaddlePaddle 'a geçirmek yoğun kaynak gerektirebilir. Ayrıca, daha yeni mimarilerle karşılaştırıldığında, PP-YOLOE+ benzer doğruluğu elde etmek için daha fazla parametre gerektirir ve kısıtlı cihazlarda depolama ve belleği etkiler.

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLOv9: Geliştirilmiş Öğrenme için Programlanabilir Gradyan Bilgisi

Ultralytics YOLOv9 derin sinir ağlarının doğasında bulunan "bilgi darboğazı" sorununu ele alarak gerçek zamanlı nesne algılamada bir paradigma değişikliği getiriyor.

Yazarlar Chien-Yao Wang ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Dokümantasyon:ultralytics

Mimari ve Temel Özellikler

YOLOv9 çığır açan iki konsepti entegre etmektedir: Programlanabilir Gradyan Bilgisi (PGI ) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).

  • PGI: Ağlar derinleştikçe, girdi veri bilgileri genellikle ileri besleme işlemi sırasında kaybolur. PGI, güvenilir gradyan üretimi sağlayan yardımcı bir denetim dalı sağlayarak modelin çıkarım maliyeti eklemeden nesne izleme ve algılama görevleri için önemli özellikleri "hatırlamasına" olanak tanır.
  • GELAN: Bu mimari tasarım, parametre verimliliğini optimize ederek modelin derinlik bazlı konvolüsyon kullanan geleneksel omurgalara kıyasla daha az hesaplama kaynağı (FLOP) ile daha yüksek doğruluk elde etmesini sağlar.

Biliyor muydunuz?

YOLOv9'un PGI tekniği, daha önce hantal derin denetim yöntemleri gerektiren bilgi darboğazı sorununu çözer. Bu da hem daha hafif hem de daha doğru modellerin ortaya çıkmasını sağlayarak performans dengesini önemli ölçüde iyileştiriyor.

Güçlü ve Zayıf Yönler

YOLOv9 , eğitim verimliliği ve parametre kullanımında üstündür. COCO veri setinde son teknoloji ürünü sonuçlar elde ederek, gerçek zamanlı hızları korurken doğrulukta önceki yinelemeleri geride bırakır. Ultralytics ekosistemine entegrasyonu, ONNX ve TensorRT gibi formatlara dışa aktarma modları aracılığıyla basit dağıtım da dahil olmak üzere iyi korunan bir ekosistemden yararlandığı anlamına gelir.

Potansiyel bir husus, en büyük varyantlarınYOLOv9) eğitim için önemli GPU kaynakları gerektirmesidir. Bununla birlikte, çıkarım belleği ayak izi rekabetçi kalır ve transformatör tabanlı modellerle ilişkili yüksek maliyetlerden kaçınır.

YOLOv9 hakkında daha fazla bilgi edinin

Karşılaştırmalı Performans Analizi

Doğrudan bir karşılaştırmada, YOLOv9 üstün verimlilik göstermektedir. Örneğin, YOLOv9 modeli PP-YOLOE+l'den (%52,9) daha yüksek bir mAP (%53,0) elde ederken parametrelerin yaklaşık yarısını (25,3M'ye karşı 52,2M) kullanmaktadır. Doğruluktan ödün vermeden model boyutundaki bu ciddi azalma, GELAN mimarisinin etkinliğini vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Tablo, benzer doğruluk hedefleri için YOLOv9 'un sürekli olarak daha az hesaplama kaynağı gerektirdiğini göstermektedir. YOLOv9 modeli, en büyük PP-YOLOE+ varyantına göre açık bir avantajla %55,6 mAP elde ederek sınırları daha da zorlamaktadır.

Ultralytics Avantajı

PP-YOLOE+ yetenekli bir dedektör olsa da, Ultralytics çerçevesi aracılığıyla YOLOv9 'u seçmek kullanım kolaylığı ve çok yönlülük açısından belirgin avantajlar sunmaktadır.

Kolaylaştırılmış Kullanıcı Deneyimi

Ultralytics , geliştirici dostu bir deneyime öncelik verir. PaddleDetection tarafından sıklıkla ihtiyaç duyulan karmaşık yapılandırma dosyalarının aksine, Ultralytics modelleri sadece birkaç satır Python kodu ile yüklenebilir, eğitilebilir ve dağıtılabilir. Bu, mühendisler ve araştırmacılar için giriş engelini önemli ölçüde azaltır.

Çok Yönlülük ve Ekosistem

Ultralytics , örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) tespiti dahil olmak üzere basit algılamanın ötesinde çok çeşitli görevleri destekler. Bu çok yönlülük, geliştiricilerin tek ve birleşik bir API kullanarak çeşitli zorlukların üstesinden gelmesine olanak tanır. Ayrıca, aktif topluluk ve sık güncellemeler, kullanıcıların en son optimizasyonlara ve TensorBoard ve MLflow gibi araçlarla entegrasyonlara erişebilmelerini sağlar.

Kod Örneği: YOLOv9 Kullanımı

Aşağıdaki örnek, Ultralytics Python API'sini kullanarak YOLOv9 ile çıkarımı ne kadar zahmetsizce çalıştırabileceğinizi göstermektedir. Bu basitlik, PP-YOLOE+ için genellikle gerekli olan daha ayrıntılı kurulumla tezat oluşturmaktadır.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display results
results[0].show()

İdeal Kullanım Senaryoları

  • PP-YOLOE+: PaddlePaddle ekosistemine zaten derinlemesine entegre olmuş ekipler veya PaddlePaddle donanım desteğinin baskın olduğu bölgelerdeki belirli eski endüstriyel uygulamalar için en uygunudur.
  • YOLOv9: Otonom araçlar, gerçek zamanlı video analitiği ve bellek gereksinimleri ile depolamanın kısıtlayıcı olduğu uç dağıtım gibi en yüksek doğruluk-verimlilik oranı gerektiren uygulamalar için idealdir.

Sonuç ve Öneriler

Çoğu geliştirici ve kuruluş için YOLOv9 , modern mimarisi (GELAN / PGI), üstün parametre verimliliği ve Ultralytics ekosisteminin sağlam desteği nedeniyle üstün seçimi temsil eder. Hazırda bulunan önceden eğitilmiş ağırlıklar ve sorunsuz dışa aktarma yetenekleri ile geleceğe dönük bir çözüm sunar.

Daha da fazla çok yönlülük ve hız arıyorsanız, şunları da keşfetmenizi öneririz YOLO11YOLO serisinin en son yinelemesi. YOLO11 , performans ve gecikme arasındaki dengeyi daha da iyileştirerek kompakt bir pakette algılama, segmentasyon ve sınıflandırma görevleri için son teknoloji yetenekler sunar.

Kanıtlanmış bir beygirle ilgilenenler için, YOLOv8 kapsamlı topluluk kaynakları ve üçüncü taraf entegrasyonları ile son derece güvenilir bir seçenek olmaya devam ediyor.


Yorumlar