PP-YOLOE+ vs YOLOX: Gerçek Zamanlı Nesne Detect Edicilerin Evriminde Yolculuk
Bilgisayar görüşü alanı, nesne detect etme modellerinin hızlı evrimiyle önemli ölçüde şekillenmiştir. Bu yolculuktaki önemli kilometre taşlarından ikisi, gerçek zamanlı performans ve doğruluk sınırlarını zorlayan PP-YOLOE+ ve YOLOX mimarileridir. Mimari nüanslarını, performans ödünleşimlerini ve ideal dağıtım senaryolarını anlamak, yeni nesil görsel tanıma sistemleri geliştiren araştırmacılar ve geliştiriciler için hayati önem taşımaktadır.
Model Soy Ağacı ve Detayları
Teknik mimarilere dalmadan önce, her iki modelin kökenlerini bağlamsallaştırmak faydalıdır. Her biri, destekleyici kuruluşlarından büyük ölçüde etkilenerek, nesne detect etme alanındaki belirli darboğazları gidermek için geliştirilmiştir.
PP-YOLOE+ Detayları:
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş: Baidu
- Tarih: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Belgeler: PaddleDetection PP-YOLOE+ README
PP-YOLOE+ hakkında daha fazla bilgi edinin
YOLOX Detayları:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- Belgeler: YOLOX Resmi Belgeleri
YOLOX hakkında daha fazla bilgi edinin
Mimari Yenilikler
Bu iki detect edici arasındaki temel farklar, özellik çıkarımı ve sınırlayıcı kutu tahmini yaklaşımlarında yatmaktadır.
YOLOX, 2021 yılında YOLO ailesini anchor-free bir tasarıma başarıyla adapte ederek büyük yankı uyandırdı. Anchor kutularını kaldırarak, YOLOX özel veri kümeleri için gereken tasarım parametrelerinin ve sezgisel ayarlamaların sayısını önemli ölçüde azalttı. Ayrıca, classify etme ve konumlandırma görevlerini ayrı sinir yollarına ayıran ayrık bir başlık tanıttı. Bu ayrım, bir nesneyi classify etme ile uzamsal koordinatlarını regresyonla tahmin etme arasındaki doğal çelişkiyi çözerek eğitim sırasında daha hızlı yakınsamaya yol açtı.
PP-YOLOE+, Baidu tarafından geliştirilmiş olup, PaddlePaddle ekosistemi için yoğun bir şekilde optimize edilmiştir. Öncülü PP-YOLOv2 üzerine inşa edilmiş olup, dinamik bir etiket atama stratejisi (TAL) ve CSPRepResNet adı verilen yeni bir backbone tanıtmaktadır. Bu backbone, yapısal yeniden parametrelendirmeden yararlanarak modelin eğitim sırasında karmaşık çok dallı mimarilerden faydalanmasını sağlarken, çıkarım için sorunsuz bir şekilde hızlı, tek yollu bir ağa dönüşmesini sağlar.
Yapısal Yeniden Parametrelendirme
Yapısal yeniden parametrelendirme, bir modelin birden fazla paralel dallarla (gradyan akışını iyileştirerek) eğitilmesine ve daha sonra bu dalları dağıtım için matematiksel olarak tek bir evrişimsel katmana dönüştürerek, doğruluğu feda etmeden çıkarım hızlarını artırmasına olanak tanır.
Performans ve Metrik Karşılaştırması
Bu modelleri karşılaştırdığımızda, performans spektrumunun biraz farklı uçlarına hizmet ettikleri açıkça görülmektedir. PP-YOLOE+ genellikle daha yüksek mutlak doğruluk elde ederken, YOLOX, oldukça kısıtlı donanımlar için uygun, son derece hafif varyantlar sunmada öne çıkmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Not: İlgili her sütun segmentindeki en iyi performans gösteren değerler kalın olarak vurgulanmıştır.
YOLOX, neredeyse hiç disk alanı veya CUDA belleği tüketmeyen nano ve tiny varyantlar sunarken, PP-YOLOE+, sunucu sınıfı donanımlara inanılmaz derecede iyi ölçeklenir ve bu da onu Baidu ekosistemi içindeki ağır endüstriyel uygulamalar için sağlam bir seçenek haline getirir.
Gerçek Dünya Uygulamaları
Bu çerçeveler arasında seçim yapmak genellikle entegrasyon gereksinimlerine ve donanım hedeflerine bağlıdır.
YOLOX'un Üstün Olduğu Alanlar
Çıpa içermeyen yapısı ve aşırı uç varyantlarının bulunması nedeniyle YOLOX, robotik ve mikrodenetleyici dağıtımlarında popülerdir. Basit işlem sonrası hattı, TensorRT ve NCNN gibi özelleştirilmiş NPU donanım formatlarına daha kolay taşınmasına olanak tanır.
PP-YOLOE+'nın Üstün Olduğu Alanlar
Baidu'nun teknoloji yığınını kullanan Asya üretim merkezlerine derinden entegre olmuş kuruluşlar için PP-YOLOE+, dağıtım için önceden optimize edilmiş bir yol sunar. Sıkı gerçek zamanlı kısıtlamaların biraz daha ağır model ağırlıklarına izin verdiği güçlü sunucu raflarında çalışan yüksek doğruluklu kalite kontrol senaryolarında öne çıkar.
Kullanım Durumları ve Öneriler
PP-YOLOE+ ve YOLOX arasında seçim yapmak, belirli proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.
Ne Zaman PP-YOLOE+ Seçmeli
PP-YOLOE+ için güçlü bir seçenektir:
- PaddlePaddle Ekosistem Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip kuruluşlar.
- Paddle Lite Kenar Dağıtımı: Özellikle Paddle Lite veya Paddle çıkarım motoru için yüksek düzeyde optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım.
- Yüksek Doğruluklu Sunucu Taraflı Algılama: Çerçeve bağımlılığının sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğunu önceliklendiren senaryolar.
Ne Zaman YOLOX Seçmeli
YOLOX şunlar için önerilir:
- Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
- Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
- SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor
PP-YOLOE+ ve YOLOX mükemmel araştırma kilometre taşlarını temsil etse de, modern dağıtım ortamı, üstün verimlilikle daha tutarlı, geliştirici dostu bir deneyim gerektirmektedir. İşte tam da bu noktada Ultralytics YOLO26, modern görsel yapay zeka için standardı tamamen yeniden tanımlıyor.
Yalıtılmış araştırma depolarından üretime hazır sistemlere geçiş yapmak isteyen ekipler için Ultralytics, sağlam ve iyi bakımlı bir ekosistem sunar. Bir model eğitmek artık karmaşık ortamlar yapılandırmayı gerektirmez; birleşik bir python API'sine erişmek kadar basittir.
Ultralytics YOLO26'nın temel avantajları şunlardır:
- Uçtan Uca NMS-Serbest Tasarım: Yedek sınırlayıcı kutuları filtrelemek için Non-Maximum Suppression (NMS) gerektiren PP-YOLOE+ ve YOLOX'un aksine, YOLO26 doğal olarak uçtan ucadır. Bu, gecikme darboğazlarını ortadan kaldırır ve dağıtım mantığını önemli ölçüde basitleştirir.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) stratejik olarak kaldırılarak, YOLO26 CPU donanımında eşsiz çıkarım hızları elde eder ve bu da onu uç bilişim ve düşük güçlü cihazlar için çok daha üstün kılar.
- MuSGD Optimizatörü: Moonshot AI'nin Kimi K2'sinden esinlenilen bu hibrit optimizatör, LLM eğitim kararlılığını bilgisayar görüşüne getirerek çok daha hızlı yakınsama sağlar ve eğitim aşamalarında bellek gereksinimlerini en aza indirir.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada önemli iyileştirmeler sağlar; bu da drone operasyonları ve yüksek detaylı hava görüntüleri için kritik bir özelliktir.
- Çok Yönlülük: PP-YOLOE+ ve YOLOX yalnızca detect'e odaklanırken, YOLO26, aynı sezgisel sözdizimini kullanarak örnek segmentasyon, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutuları (obb) sorunsuz bir şekilde yönetir.
YOLO26 hakkında daha fazla bilgi edinin
Ultralytics ile Kolaylaştırılmış Eğitim
Ultralytics modellerinin bellek verimliliği ve eğitim hızı eşsizdir ve büyük CUDA bellek yükü gerektiren transformatör tabanlı alternatifleri tamamen geride bırakır. YOLO26'nın gücünden sadece birkaç satır kodla yararlanabilirsiniz:
from ultralytics import YOLO
# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
# Export seamlessly to ONNX or TensorRT
model.export(format="engine")
Ultralytics Platformunu Keşfedin
Kodsuz bir çözüm arayan ekipler için Ultralytics Platformu, tüm YOLO modelleriniz için bulut tabanlı eğitim, entegre veri kümesi açıklama ve tek tıklamayla dağıtım sağlar.
Sonuç
Hem PP-YOLOE+ hem de YOLOX, sırasıyla yüksek doğruluk ve hafif, çıpa içermeyen tasarımlar sunarak bilgisayar görüşü tarihinde yerlerini almışlardır. Ancak, tarımda yapay zeka, akıllı şehirler ve perakende sektörünün geleceğini inşa eden kuruluşlar için Ultralytics YOLO26'nın sürekli bakımı, kullanım kolaylığı ve yerel NMS-serbest mimarisi, onu tartışmasız bir seçenek haline getirmektedir.
Belirli kıyaslamalar için alternatif mimariler araştırıyorsanız, kapsamlı Ultralytics dokümantasyonu aracılığıyla daha eski YOLO11 veya RT-DETR gibi transformatör tabanlı seçenekleri karşılaştırmakta da fayda bulabilirsiniz. Birleşik Ultralytics ekosistemine geçerek geliştiriciler, herhangi bir uç veya bulut dağıtımında son teknoloji sonuçlar elde ederken paha biçilmez zaman ve kaynaklardan tasarruf ederler.