İçeriğe geç

PP-YOLOE+ - YOLOv9 Karşılaştırması: Teknik Bir Karşılaştırma

Bilgisayar görüşü projeleri için optimal mimariyi seçmek, hızla gelişen modeller arasında gezinmeyi gerektirir. Bu sayfa, Baidu'nun PP-YOLOE+'ı ve YOLOv9 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır; bu iki gelişmiş tek aşamalı nesne dedektörüdür. Bilinçli bir karar vermenize yardımcı olmak için mimari yeniliklerini, performans metriklerini ve ekosistem entegrasyonunu analiz ediyoruz. Her iki model de yüksek yetenekler gösterirken, farklı tasarım felsefelerini ve çerçeve bağımlılıklarını temsil etmektedir.

PP-YOLOE+: PaddlePaddle Ekosistemi İçinde Yüksek Doğruluk

PP-YOLOE+, Baidu tarafından PaddleDetection paketinin bir parçası olarak geliştirilen PP-YOLOE'nin gelişmiş bir sürümüdür. Özellikle PaddlePaddle derin öğrenme çerçevesi için optimize edilmiş, hassasiyet ve çıkarım hızı arasında dengeli bir denge sağlamak üzere tasarlanmıştır.

Yazarlar: PaddlePaddle Yazarları
Kuruluş:Baidu
Tarih: 2022-04-02
Arxiv:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
Belgeler:PaddleDetection PP-YOLOE+ README

Mimari ve Temel Özellikler

PP-YOLOE+, ankraj içermeyen, tek aşamalı bir detectör olarak çalışır. CSPRepResNet omurgası üzerine inşa edilmiştir ve sınıflandırma ile lokalizasyon görevleri arasındaki hizalamayı iyileştirmek için Görev Hizalama Öğrenimi (TAL) stratejisini kullanır. Temel bir özellik, doğruluğu korurken hesaplama yükünü azaltan Verimli Görev Hizalı Başlık'tır (ET-Head). Model, eğitim sırasında sınıf dengesizliğini ele almak için bir Varifokal Kayıp fonksiyonu kullanır.

Güçlü ve Zayıf Yönler

PP-YOLOE+'nın temel gücü, Baidu'nun donanım ve yazılım yığını için optimizasyonunda yatmaktadır. Standart nesne algılama kıyaslamalarında iyi performans gösteren ölçeklenebilir modeller (s, m, l, x) sunar.

Ancak, PaddlePaddle ekosistemine olan ağır bağımlılığı, büyük ölçüde PyTorch'u tercih eden daha geniş yapay zeka topluluğu için önemli bir engel teşkil ediyor. Mevcut PyTorch iş akışlarını PaddlePaddle'a geçirmek kaynak yoğun olabilir. Ek olarak, daha yeni mimarilerle karşılaştırıldığında, PP-YOLOE+, benzer doğruluğa ulaşmak için daha fazla parametre gerektirir ve bu da kısıtlı cihazlarda depolama ve belleği etkiler.

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLOv9: Gelişmiş Öğrenme için Programlanabilir Gradyan Bilgisi

Ultralytics YOLOv9, derin sinir ağlarında var olan "bilgi darboğazı" sorununu ele alarak gerçek zamanlı nesne tespiti konusunda bir paradigma değişikliği sunuyor.

Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Belgelendirme:https://docs.ultralytics.com/models/yolov9/

Mimari ve Temel Özellikler

YOLOv9, iki çığır açan konsepti entegre eder: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).

  • PGI: Ağlar derinleştikçe, ileri besleme sürecinde girdi verisi bilgileri genellikle kaybolur. PGI, güvenilir gradyan üretimi sağlayan ve modelin çıkarım maliyeti eklemeden nesne takibi ve detect görevleri için önemli özellikleri "hatırlamasını" sağlayan yardımcı bir denetim dalı sağlar.
  • GELAN: Bu mimari tasarım, parametre verimliliğini optimize ederek, modelin derinlemesine evrişim kullanan geleneksel backbonelere kıyasla daha az hesaplama kaynağı (FLOP) ile daha yüksek doğruluk elde etmesini sağlar.

Biliyor muydunuz?

YOLOv9'un PGI tekniği, daha önce hantal derin denetim yöntemleri gerektiren bilgi darboğazı sorununu çözer. Bu, hem daha hafif hem de daha doğru olan ve performans dengesini önemli ölçüde iyileştiren modellerle sonuçlanır.

Güçlü ve Zayıf Yönler

YOLOv9, eğitim verimliliği ve parametre kullanımında mükemmeldir. COCO veri kümesinde son teknoloji sonuçlar elde eder ve gerçek zamanlı hızları korurken önceki yinelemeleri doğruluk açısından geride bırakır. Ultralytics ekosistemine entegrasyonu, ONNX ve TensorRT gibi formatlara dışa aktarma modları aracılığıyla basit dağıtım dahil olmak üzere iyi yönetilen bir ekosistemden yararlandığı anlamına gelir.

Olası bir husus, en büyük varyantların (YOLOv9-E) eğitim için önemli GPU kaynakları gerektirmesidir. Ancak, çıkarım bellek ayak izi rekabetçi kalır ve transformatör tabanlı modellerle ilişkili yüksek maliyetlerden kaçınılır.

YOLOv9 hakkında daha fazla bilgi edinin

Karşılaştırmalı Performans Analizi

Doğrudan bir karşılaştırmada, YOLOv9 üstün verimlilik gösterir. Örneğin, YOLOv9-C modeli, PP-YOLOE+l'den (%52,9) daha yüksek bir mAP (%53,0) elde ederken, yaklaşık parametrelerin yarısını kullanır (25,3M'ye karşı 52,2M). Doğruluktan ödün vermeden model boyutundaki bu önemli azalma, GELAN mimarisinin etkinliğini vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Tablo, benzer doğruluk hedefleri için YOLOv9'un sürekli olarak daha az hesaplama kaynağı gerektirdiğini göstermektedir. YOLOv9-E modeli, %55,6 mAP'ye ulaşarak zarfı daha da zorlar ve en büyük PP-YOLOE+ varyantına göre açık bir avantaj sağlar.

Ultralytics'in Avantajı

PP-YOLOE+ yetenekli bir dedektör olsa da, Ultralytics çerçevesi aracılığıyla YOLOv9'u seçmek, kullanım kolaylığı ve çok yönlülük açısından belirgin avantajlar sunar.

Kolaylaştırılmış Kullanıcı Deneyimi

Ultralytics, geliştirici dostu bir deneyime öncelik verir. PaddleDetection tarafından sıklıkla gerekli olan karmaşık yapılandırma dosyalarının aksine, Ultralytics modelleri birkaç satır Python koduyla yüklenebilir, eğitilebilir ve dağıtılabilir. Bu, mühendisler ve araştırmacılar için giriş engelini önemli ölçüde azaltır.

Çok Yönlülük ve Ekosistem

Ultralytics, örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (obb) algılama dahil olmak üzere basit algılamanın ötesinde çok çeşitli görevleri destekler. Bu çok yönlülük, geliştiricilerin tek, birleşik bir API kullanarak çeşitli zorlukların üstesinden gelmelerini sağlar. Ayrıca, aktif topluluk ve sık güncellemeler, kullanıcıların TensorBoard ve MLflow gibi araçlarla en son optimizasyonlara ve entegrasyonlara erişebilmelerini sağlar.

Kod Örneği: YOLOv9 Kullanımı

Aşağıdaki örnek, Ultralytics Python API'sini kullanarak YOLOv9 ile ne kadar zahmetsizce çıkarım çalıştırabileceğinizi göstermektedir. Bu basitlik, genellikle PP-YOLOE+ için gereken daha ayrıntılı kurulumla tezat oluşturmaktadır.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display results
results[0].show()

İdeal Kullanım Senaryoları

  • PP-YOLOE+: Zaten Baidu/PaddlePaddle ekosistemine derinlemesine entegre olmuş ekipler veya PaddlePaddle donanım desteğinin baskın olduğu bölgelerdeki belirli eski endüstriyel uygulamalar için en uygunudur.
  • YOLOv9: Otonom araçlar, gerçek zamanlı video analitiği ve bellek gereksinimleri ve depolama alanının kısıtlamalar olduğu uç dağıtımı gibi en yüksek doğruluk-verimlilik oranını gerektiren uygulamalar için idealdir.

Sonuç ve Öneriler

Çoğu geliştirici ve kuruluş için, modern mimarisi (GELAN/PGI), üstün parametre verimliliği ve Ultralytics ekosisteminin güçlü desteği nedeniyle YOLOv9 üstün bir seçimdir. Hazırda bulunan önceden eğitilmiş ağırlıklar ve sorunsuz dışa aktarma yetenekleri ile geleceğe dönük bir çözüm sunar.

Daha da fazla çok yönlülük ve hız arıyorsanız, YOLO serisinin en son sürümü olan YOLO11'i de incelemenizi öneririz. YOLO11, performans ve gecikme arasındaki dengeyi daha da iyileştirerek, kompakt bir pakette algılama, segmentasyon ve sınıflandırma görevleri için son teknoloji yetenekler sunar.

Kanıtlanmış bir araç arayanlar için, YOLOv8 kapsamlı topluluk kaynakları ve üçüncü taraf entegrasyonları ile oldukça güvenilir bir seçenek olmaya devam ediyor.


Yorumlar