PP-YOLOE+ vs YOLOX: Gelişmiş Ankrajsız Nesne Algılama Karşılaştırması
En uygun nesne algılama mimarisinin seçilmesi; doğruluk, çıkarım hızı ve dağıtım karmaşıklığı arasındaki dengelerin derinlemesine anlaşılmasını gerektirir. Bu kılavuz, Baidu'nun endüstriyel sınıf dedektörü PP-YOLOE+ ile Megvii'nin yüksek performanslı çapasız modeli YOLOX arasında teknik bir karşılaştırma sunmaktadır. Her iki mimari de çapasız dedektörlere geçişte önemli kilometre taşları oluşturmuş ve bilgisayarla görme mühendisleri için sağlam çözümler sunmuştur.
PP-YOLOE+: Baidu'dan Endüstriyel Mükemmellik
PP-YOLOE+, PaddlePaddle Yazarları tarafından PP-YOLOE'nin geliştirilmiş bir versiyonudur. Baidu. Nisan 2022'de piyasaya sürülen bu ürün, kapsamlı PaddleDetection paketinin bir parçasıdır. Endüstriyel uygulamalar için özel olarak tasarlanan PP-YOLOE+, PaddlePaddle çerçevesinin yeteneklerinden yararlanarak eğitim verimliliği ve çıkarım hassasiyeti arasındaki dengeyi optimize eder.
Teknik Detaylar:
- Yazarlar: PaddlePaddle Yazarları
- Organizasyon:Baidu
- Tarih: 2022-04-02
- Arxiv Bağlantısı:YOLO'nun Geliştirilmiş Bir Versiyonu
- GitHub Bağlantısı:PaddleDetection Deposu
- Dokümanlar Bağlantısı:PP-YOLOE+ Dokümantasyonu
Mimari ve Temel Özellikler
PP-YOLOE+, farklı donanımlarda performansı en üst düzeye çıkarmayı amaçlayan çeşitli mimari yeniliklerle öne çıkmaktadır:
- Ölçeklenebilir Backbone: Artık Ağların özellik çıkarma gücünü Çapraz Aşamalı Kısmi ( CSP) bağlantıların verimliliği ile birleştiren bir backbone olan CSPRepResNet'i kullanır.
- Görev Hizalama Öğrenimi (TAL): Kritik bir yenilik, sınıflandırma ve yerelleştirme görevlerini dinamik olarak hizalayan ve en yüksek güven puanlarının en doğru sınırlayıcı kutulara karşılık gelmesini sağlayan özel bir kayıp fonksiyonu olan TAL'in kullanılmasıdır.
- Verimli Görev Hizalamalı Başlık (ET-Head): Model, algılama kafası tasarımını basitleştiren ve yüksek hassasiyeti korurken hesaplama yükünü azaltan çapasız bir kafa kullanır.
Güçlü ve Zayıf Yönler
PP-YOLOE+ belirli dağıtım senaryoları için bir güç merkezidir ancak ekosistem kısıtlamalarıyla birlikte gelir.
Güçlü Yönler:
- Son Teknoloji Doğruluk: Model, COCO veri setinde olağanüstü sonuçlar elde ederek PP-YOLOE+x varyantının %54,7 mAP'ye ulaşmasıyla kusur tespiti gibi yüksek hassasiyetli görevler için uygun hale gelmiştir.
- Çıkarım Verimliliği: PaddlePaddle çerçevesindeki operatör füzyonu gibi optimizasyonlar sayesinde, özellikle daha büyük model boyutları için GPU donanımında rekabetçi hızlar sunar.
Zayıflıklar:
- Çerçeve Bağımlılığı: Birincil güven PaddlePaddle ekosistemi, standartlaştırılmış ekipler için bir engel olabilir PyTorch veya TensorFlow.
- Dağıtım Karmaşıklığı: Bu modellerin diğer çıkarım motorlarına ( ONNX Runtime veya TensorRT gibi) taşınması genellikle tüm özel operatörleri kutudan çıktığı anda desteklemeyebilecek özel dönüştürme araçları gerektirir.
PP-YOLOE+ hakkında daha fazla bilgi edinin
YOLOX: Çapasız Öncü
YOLOX, 2021 yılında şu şirketteki araştırmacılar tarafından tanıtıldı Megvii. Algılama kafasını ayırması ve çapaları kaldırmasıyla hemen dikkat çekmiştir; bu hareket, önceki YOLO yinelemelerine kıyasla eğitim hattını önemli ölçüde basitleştirmiştir. YOLOX, akademik araştırma ile pratik endüstriyel uygulama arasındaki boşluğu doldurarak sonraki birçok nesne algılama mimarisini etkiledi.
Teknik Detaylar:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Organizasyon:Megvii
- Tarih: 2021-07-18
- Arxiv Bağlantısı:YOLOX: 2021'de YOLO Serisinin Aşılması
- GitHub Bağlantısı:YOLOX Deposu
- Dokümanlar Bağlantısı:YOLOX Dokümantasyonu
Mimari ve Temel Özellikler
YOLOX, YOLO ailesine "çapa gerektirmeyen" bir tasarım felsefesi getirmiştir:
- Ayrılmış Başlık: Birleştirilmiş dallarda sınıflandırma ve yerelleştirme yapan geleneksel YOLO başlıklarının aksine, YOLOX bu görevleri ayırır. Bu ayrıştırma, yakınsama hızını ve nihai doğruluğu artırır.
- SimOTA Etiket Ataması: YOLOX, her bir temel gerçek nesnesi için en iyi pozitif örnekleri otomatik olarak seçen ve karmaşık hiperparametre ayarlama ihtiyacını azaltan dinamik bir etiket atama stratejisi olan SimOTA 'yı (Basitleştirilmiş Optimal Taşıma Ataması) kullanır.
- Çapasız Mekanizma: Önceden tanımlanmış bağlantı kutularını ortadan kaldırarak YOLOX, tasarım parametrelerinin sayısını azaltır ve özellikle aşırı en boy oranlarına sahip olanlar için nesne şekilleri arasında genelleştirmeyi geliştirir.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Uygulama Basitliği: Çapaların kaldırılması ve standart PyTorch işlemlerinin kullanılması, kod tabanının anlaşılmasını ve araştırma amacıyla değiştirilmesini nispeten kolaylaştırır.
- Güçlü Temel: Gelişmiş eğitim teknikleri ve mimari değişikliklere yönelik akademik araştırmalar için mükemmel bir temel teşkil eder.
Zayıflıklar:
- Eskiyen Performans: 2021'de devrim niteliğinde olsa da, ham performans ölçümleri (hız / doğruluk ödünleşimi) aşağıdaki gibi daha yeni modeller tarafından aşıldı YOLOv8 ve YOLO11.
- Eğitim Kaynak Yoğunluğu: SimOTA gibi gelişmiş atama stratejileri, daha basit statik atama yöntemlerine kıyasla eğitim aşamasında hesaplama yükünü artırabilir.
Eski Destek
YOLOX hala araştırmalarda yaygın olarak kullanılsa da, uzun vadeli destek ve aktif güncellemeler arayan geliştiriciler, üretim ortamları için daha yeni mimarileri daha faydalı bulabilir.
YOLOX hakkında daha fazla bilgi edinin
Teknik Performans Karşılaştırması
PP-YOLOE+ ve YOLOX arasında seçim yaparken, standart karşılaştırma ölçütleri üzerindeki performans ölçümleri karar vermek için en objektif temeli sağlar. Aşağıdaki veriler, COCO doğrulama setindeki performanslarını vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Analiz
- Doğruluk Üstünlüğü: PP-YOLOE+, karşılaştırılabilir model boyutlarında YOLOX'tan sürekli olarak daha iyi performans göstermektedir. PP-YOLOE+x modeli %54,7 mAP elde ederek YOLOX-x'in %51,1'ine kıyasla önemli bir gelişme kaydetmiştir.
- Verimlilik: PP-YOLOE+ üstün parametre verimliliği gösterir. Örneğin
svaryantı daha az parametre (7.93M'ye karşı 9.0M) ve FLOP kullanırken daha yüksek doğruluk (%43.7'ye karşı %40.5) elde eder. - Çıkarım Hızı: YOLOX daha küçük boyutlarda rekabetçi olmaya devam ederken, PP-YOLOE+ GPU donanımında (T4 TensorRT) daha iyi ölçeklenir ve daha yüksek doğruluğa rağmen büyük ve ekstra büyük modelleri için daha yüksek hızlar sunar.
Ultralytics YOLO11: Modern Standart
PP-YOLOE+ ve YOLOX yetenekli dedektörler olsa da, bilgisayarla görme alanı hızla gelişmektedir. Performans, kullanılabilirlik ve ekosistem desteğinin optimum karışımını arayan geliştiriciler için, Ultralytics YOLO11 en son teknoloji ürünü seçimi temsil eder.
Neden Ultralytics YOLO11'i Seçmelisiniz?
- Kullanım Kolaylığı: Araştırma depoları veya çerçeveye özgü araçlar için genellikle gerekli olan karmaşık kurulumun aksine, YOLO11 kolaylaştırılmış bir Python API ve CLI sunar. Kurulumdan çıkarıma saniyeler içinde geçebilirsiniz.
- Bakımlı Ekosistem: Ultralytics modelleri, sık güncellemeler, kapsamlı belgeler ve MLOps araçlarıyla sorunsuz entegrasyon içeren sağlam bir ekosistem tarafından desteklenmektedir.
- Performans Dengesi: YOLO11 , hem eğitim hem de çıkarım sırasında daha düşük bellek gereksinimleri ile önceki nesillerden daha iyi performans göstererek hız ve doğruluk arasında uygun bir denge sağlamak üzere tasarlanmıştır.
- Çok yönlülük: PP-YOLOE+ ve YOLOX öncelikle sınırlayıcı kutu tespitine odaklanırken, YOLO11 örnek segmentasyonunu, poz tahminini, yönlendirilmiş sınırlayıcı kutuları (OBB) ve sınıflandırmayı tek bir çerçeve içinde yerel olarak destekler.
- Eğitim Verimliliği: Ultralytics modelleri, yakınsamaya ulaşmak için gereken süreyi ve hesaplama kaynaklarını azaltmak için gelişmiş güçlendirmeler ve kolayca bulunabilen önceden eğitilmiş ağırlıklar kullanılarak verimli eğitim için optimize edilmiştir.
Gerçek Dünya Örneği
YOLO11 ile nesne algılamayı uygulamak sezgiseldir. Aşağıdaki örnekte önceden eğitilmiş bir modelin nasıl yükleneceği ve bir görüntü üzerinde nasıl çıkarım yapılacağı gösterilmektedir:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
Bu basitlik, diğer mimariler için genellikle gerekli olan çok adımlı yapılandırmayla keskin bir tezat oluşturarak geliştiricilerin kodla boğuşmak yerine iş sorunlarını çözmeye odaklanmasına olanak tanır.
Sonuç
Hem PP-YOLOE+ hem de YOLOX bilgisayarla görme alanına önemli katkılarda bulunmuştur. PP-YOLOE+, yüksek endüstriyel doğruluk gerektiren Baidu PaddlePaddle ekosistemine derinlemesine entegre olanlar için mükemmel bir seçimdir. YOLOX, çapasız metodolojileri araştıran araştırmacılar için saygın bir temel olmaya devam etmektedir.
Ancak, yeni projelerin çoğunluğu için, Ultralytics YOLO11 en cazip paketi sunuyor. Üstün performans, düşük bellek kullanımı ve eşsiz geliştirici deneyiminin birleşimi, onu ölçeklenebilir gerçek zamanlı çıkarım çözümlerinin dağıtımı için üstün bir seçim haline getirmektedir.
YOLO11 hakkında daha fazla bilgi edinin