YOLOv9 - PP-YOLOE+: Teknik Bir Karşılaştırma
Optimum nesne algılama mimarisini seçmek, bilgisayar görüşü mühendisleri için yüksek hassasiyet ihtiyacını hesaplama kısıtlamalarıyla dengeleyen çok önemli bir karardır. Bu kapsamlı kılavuz, yeni gradyan bilgi teknikleri sunan son teknoloji bir model olan YOLOv9 ve PaddlePaddle çerçevesi için optimize edilmiş sağlam bir detectör olan PP-YOLOE+'ı karşılaştırır. Bilgisayar görüşü uygulamalarınız için en uygun olanı belirlemenize yardımcı olmak için mimari yeniliklerini, kıyaslama performansını ve dağıtım uygunluğunu analiz ediyoruz.
YOLOv9: Gelişmiş Öğrenme için Programlanabilir Gradyan Bilgisi
YOLOv9, gerçek zamanlı nesne algılayıcılarının evriminde önemli bir sıçramayı temsil ediyor. 2024'ün başlarında piyasaya sürülen bu sürüm, derin sinir ağlarındaki bilgi kaybıyla ilgili temel sorunları ele alarak doğruluk ve parametre verimliliği için yeni ölçütler belirliyor.
Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Belgelendirme:https://docs.ultralytics.com/models/yolov9/
Mimari, iki çığır açan konsept sunar: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). Ağlar derinleştikçe, kayıp fonksiyonunu hesaplamak için gerekli olan veriler kaybolabilir; bu, bilgi darboğazı olarak bilinen bir olgudur. PGI, derin özelliklerin kritik bilgileri korumasını sağlayarak yardımcı bir tersine çevrilebilir dal aracılığıyla güvenilir gradyanlar oluşturarak bunu çözer. Eşzamanlı olarak GELAN, parametre kullanımını optimize ederek modelin derinlemesine evrişim tabanlı mimarilere kıyasla daha az hesaplama kaynağıyla üstün doğruluk elde etmesini sağlar.
Ultralytics ekosistemine entegre edilen YOLOv9, karmaşık iş akışlarını basitleştiren kullanıcı odaklı bir tasarımdan yararlanır. Geliştiriciler, prototipten üretime geçiş sücresini büyük ölçüde azaltan eğitim, doğrulama ve dağıtım için birleşik bir Python API'sinden yararlanabilir. Bu entegrasyon aynı zamanda geniş bir veri kümesi ve dışa aktarma formatıyla uyumluluğu da sağlar.
YOLOv9 hakkında daha fazla bilgi edinin
PP-YOLOE+: PaddlePaddle Ekosistemi İçinde Yüksek Doğruluk
PP-YOLOE+, PaddleDetection paketinin bir parçası olarak Baidu tarafından geliştirilen PP-YOLOE'nin geliştirilmiş bir versiyonudur. Özellikle PaddlePaddle çerçevesinde verimli bir şekilde çalışacak şekilde tasarlanmıştır ve endüstriyel uygulamalar için güçlü bir hız ve hassasiyet dengesi sunar.
Yazarlar: PaddlePaddle Yazarları
Kuruluş:Baidu
Tarih: 2022-04-02
Arxiv:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
Belgeleme:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
PP-YOLOE+, hiperparametre ayarlama sürecini basitleştiren önceden tanımlanmış anchor boxlara olan ihtiyacı ortadan kaldıran bir anchor-free mekanizması kullanır. Backbone'u tipik olarak CSPRepResNet kullanır ve Görev Hizalama Öğrenimi (TAL) tarafından desteklenen benzersiz bir head tasarımına sahiptir. Bu yaklaşım, detect sonuçlarının kalitesini artırmak için sınıflandırma ve yerelleştirme görevlerini hizalar. Oldukça yetenekli olmasına rağmen, PP-YOLOE+, PyTorch veya TensorFlow üzerinde standartlaştırılmış ekipler için bir öğrenme eğrisi sunabilen PaddlePaddle ekosistemiyle sıkı bir şekilde bağlantılıdır.
Ekosistem Bağımlılığı
PP-YOLOE+ rekabetçi performans sunsa da, PaddlePaddle çerçevesine olan bağımlılığı, Batı araştırma topluluğunda yaygın olarak kullanılan daha geniş PyTorch tabanlı araçlar ve kütüphanelerle birlikte çalışabilirliği sınırlayabilir.
PP-YOLOE+ hakkında daha fazla bilgi edinin
Performans Analizi: Hız, Doğruluk ve Verimlilik
Bu iki mimariyi karşılaştırırken, YOLOv9 hem parametre verimliliği hem de tepe doğrulukta açık bir avantaj gösterir. GELAN'ın entegrasyonu, YOLOv9'un görsel verileri daha etkili bir şekilde işlemesini sağlayarak, genellikle daha düşük gecikme süresini korurken ortalama Ortalama Hassasiyet (mAP) puanlarını COCO veri kümesi üzerinde yükseltir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Temel Çıkarımlar
- Parametre Verimliliği: YOLOv9-T modeli, 4.85M'de PP-YOLOE+t varyantından önemli ölçüde daha az olan yalnızca 2.0M parametre kullanırken daha büyük modellere kıyasla karşılaştırılabilir performans elde eder. Bu, YOLOv9'u sınırlı depolama alanına sahip edge AI cihazları için özellikle uygun hale getirir.
- En Yüksek Doğruluk:YOLOv9-E, yaklaşık %40 daha az parametre (57,3M'ye karşı 98,42M) kullanmasına rağmen, en büyük PP-YOLOE+x modelini (%54,7 mAP) aşarak dikkat çekici bir %55,6 mAP elde eder. Bu, GELAN'ın özellik çıkarma yeteneklerini en üst düzeye çıkarmadaki mimari üstünlüğünü vurgular.
- Çıkarım Hızı: PP-YOLOE+s, T4 GPU'larında ham gecikmede hafif bir avantaj gösterse de, YOLOv9 modelleri genellikle daha iyi bir denge sunarak benzer hesaplama maliyetleri için önemli ölçüde daha yüksek doğruluk sağlar. Örneğin, YOLOv9-C, daha hızlı (7,16 ms'ye karşı 8,36 ms) ve daha hafif olurken, doğrulukta PP-YOLOE+l'den (53,0%'a karşı 52,9%) daha iyi performans gösterir.
Eğitim Metodolojisi ve Kullanım Kolaylığı
Geliştirici deneyimi, öncelikle temel çerçeveleri ve ekosistem destekleri nedeniyle iki model arasında önemli ölçüde farklılık gösterir.
Ultralytics Ekosistem Avantajı
YOLOv9'u Ultralytics aracılığıyla seçmek, makine öğrenimi yaşam döngüsünü kolaylaştırmak için tasarlanmış kapsamlı bir araç paketine erişim sağlar.
- Basit API: Bir modeli eğitmek, karmaşık temel kodları soyutlayarak yalnızca birkaç satır kod gerektirir.
- Bellek Verimliliği: Ultralytics YOLO modelleri, transformatör tabanlı mimarilere kıyasla eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir ve tüketici sınıfı donanımda daha büyük toplu iş boyutlarına olanak tanır.
- Çeşitlilik: Detect işleminin ötesinde, Ultralytics çerçevesi örnek segmentasyonunu, poz tahminini ve sınıflandırmayı destekleyerek çeşitli görevler için birleşik bir arayüz sunar.
- Verimli Eğitim: Gelişmiş veri artırma ve kolayca kullanılabilen önceden eğitilmiş ağırlıklarla, geliştiriciler daha hızlı yakınsama elde edebilir ve değerli GPU saatlerinden tasarruf edebilir.
Ultralytics ile Kolaylaştırılmış İş Akışı
Otomatik hiperparametre ayarlama ve deney takibi için güçlü Ultralytics motorundan yararlanarak yalnızca birkaç satır Python koduyla bir YOLOv9 modelini yükleyebilir, eğitebilir ve doğrulayabilirsiniz.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
PaddlePaddle Ortamı
PP-YOLOE+, PaddleDetection kütüphanesini gerektirir. Güçlü olmasına rağmen, Baidu ekosistemine aşinalık gerektirir. Ortamı kurmak, veri kümelerini gerekli formata dönüştürmek ve modelleri dağıtım için dışa aktarmak, halihazırda PaddlePaddle altyapısına dahil olmayan kullanıcılar için daha karmaşık olabilir.
İdeal Kullanım Senaryoları
Her modelin güçlü yönlerini anlamak, belirli gerçek dünya uygulamaları için doğru aracı seçmeye yardımcı olur.
Ne Zaman YOLOv9 Seçmeli
- Otonom Sistemler: Sürücüsüz arabalar ve robotik için, güvenlik açısından doğruluğu en üst düzeye çıkarmak kritik öneme sahip olduğundan, YOLOv9-E'nin üstün mAP değeri gerekli güvenilirliği sağlar.
- Uç Nokta Dağıtımı: Hafif YOLOv9-T, insan sayımı veya akıllı perakende analitiği gibi görevler için Raspberry Pi veya NVIDIA Jetson cihazlarına dağıtmak için mükemmeldir.
- Araştırma ve Geliştirme: İyi yönetilen ekosistem ve PyTorch desteği, onu yeni bilgisayarla görme çözümleri prototipleme veya nesne takibi yeteneklerini entegre etme konusunda araştırmacılar için ideal hale getirir.
- Kaynak Kısıtlı Ortamlar: Sınırlı VRAM ile yüksek performans gerektiren uygulamalar, YOLOv9'un verimli mimarisinden ve daha düşük bellek ayak izinden yararlanır.
Ne Zaman PP-YOLOE+ Seçmeli
- PaddlePaddle Kullanıcıları: Zaten Baidu'nun altyapısını kullanan kuruluşlar için PP-YOLOE+, sorunsuz entegrasyon ve yerel optimizasyon sunar.
- Endüstriyel Denetim (Çin): Asya pazarında güçlü bir şekilde benimsenmesi nedeniyle, genellikle belirli Paddle çıkarım donanımına dayanan üretim hatlarında bulunur.
Sonuç
Her iki model de nesne algılama alanında zorlu rakipler olsa da, YOLOv9 küresel geliştiricilerin ve işletmelerin çoğunluğu için üstün bir seçim olarak ortaya çıkıyor. Yenilikçi Programlanabilir Gradyan Bilgisi (PGI) kullanımı, önemli ölçüde daha az parametre kullanırken temel metriklerde PP-YOLOE+'dan daha iyi performans göstererek olağanüstü verimlilikle en son teknoloji doğruluğu sağlar.
Ayrıca, Ultralytics ekosistemi, benzersiz kullanım kolaylığı, kapsamlı dokümantasyon ve canlı bir topluluk sağlayarak YOLOv9'u yükseltir. İster güvenlik alarm sistemleri kuruyor, ister tıbbi görüntüleri analiz ediyor veya akıllı şehir altyapısı geliştiriyor olun, YOLOv9 başarılı olmak için gereken performans dengesini ve çok yönlülüğü sunar.
Dikkate Alınması Gereken Diğer Modeller
Son teknoloji ürünü vizyon yapay zekasını araştırıyorsanız, Ultralytics'in bu diğer güçlü modellerini göz önünde bulundurun:
- YOLO11: YOLO serisindeki en son evrim, en yeni uygulamalar için daha da yüksek hızlar ve daha yüksek doğruluk sunar.
- YOLOv8: Algılama, segmentasyon, poz ve OBB görevlerini destekleyen, oldukça çok yönlü bir endüstri standardıdır.
- RT-DETR: Doğruluğuyla öne çıkan, CNN tabanlı mimarilere bir alternatif sunan gerçek zamanlı, dönüştürücü tabanlı bir dedektör.