PP-YOLOE+ ve YOLO11: Yüksek Performanslı Nesne Algılamanın Evrimini Keşfetmek
Hızla gelişen bilgisayar görme alanında, doğru model mimarisini seçmek, doğruluk, hız ve dağıtım kısıtlamaları arasında denge sağlamak için çok önemlidir. Bu karşılaştırma, algılama tarihindeki iki önemli dönüm noktasını incelemektedir: PaddlePaddle , geliştirilmiş bir çapa içermeyen algılayıcı olan PP-YOLOE+ ve YOLO11, üstün verimlilik ve çok yönlülük için Ultralytics in son teknoloji ürünü bir yinelemesi.
PP-YOLOE+, belirli çerçeveler içindeki endüstriyel uygulamalar için olgun bir çözüm sunarken, YOLO11 mimari iyileştirmelerle uç cihazlarda mümkün olanın sınırlarını YOLO11 . Ayrıca, yerel uçtan uca NMS algılama özelliği sunan en son çığır açan ürün olan YOLO26'yı da sabırsızlıkla bekliyoruz.
Performans Metrikleri Karşılaştırması
Aşağıdaki tablo, temel performans göstergelerinin doğrudan karşılaştırmasını sunmaktadır. YOLO11 verimlilik açısından açık bir avantaj sergilerken, önemli ölçüde azaltılmış parametre sayısı ve daha hızlı çıkarım hızları ile karşılaştırılabilir veya daha üstün bir doğruluk sunar.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+: PaddlePaddle
PP-YOLOE+, Baidu araştırmacıları tarafından PaddleDetection araç setinin bir parçası olarak geliştirilen PP-YOLOE'nin yükseltilmiş bir sürümüdür. Önceki sürümün eğitim yakınsama hızını ve aşağı akış görev performansını iyileştirmeye odaklanmaktadır.
Teknik Mimari
PP-YOLOE+, etiket ataması için CSPRepResNet backbone Görev Hizalama Öğrenimi (TAL) stratejisini kullanan, çapa içermeyen bir modeldir. Özellik temsilini geliştirmek için boyun kısmında benzersiz bir ESE (Etkili Sıkıştırma ve Uyarma) dikkat mekanizması kullanır. Önemli bir mimari seçim, RepVGG tarzı yeniden parametreleştirmenin kullanılmasıdır. Bu, modelin, çıkarım sırasında daha basit ve daha hızlı yapılara dönüşen karmaşık eğitim dinamiklerine sahip olmasını sağlar.
Temel özellikler şunları içerir:
- Çapa İçermeyen Başlık: önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırarak tasarımı basitleştirir.
- Görev Hizalama Öğrenimi (TAL): Hassasiyeti artırmak için sınıflandırma ve regresyon görevlerini dinamik olarak hizalar.
- Object365 Ön eğitim: "Plus" (+) sürümü, büyük Objects365 veri seti üzerinde yapılan güçlü ön eğitimden büyük ölçüde yararlanır ve bu da daha küçük veri setlerinde yakınsama hızını önemli ölçüde artırır.
Meta Veriler:
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş:Baidu
- Tarih: 2022-04-02
- Arxiv:PP-YOLOE: YOLO'nun Gelişmiş Bir Versiyonu
- GitHub:PaddlePaddle/PaddleDetection
Ekosistem Kısıtlamaları
PP-YOLOE+ güçlü bir performans sunarken, PaddlePaddle derin öğrenme çerçevesiyle sıkı bir şekilde bağlantılıdır. PyTorch TensorFlow a alışkın geliştiriciler, Paddle Inference'ı yerel olarak desteklemeyen mevcut MLOps boru hatlarına entegre ederken zorlu bir öğrenme süreci ve sürtüşmeyle TensorFlow .
PP-YOLOE+ hakkında daha fazla bilgi edinin
Ultralytics YOLO11: Verimliliği Yeniden Tanımlamak
Yayınlayan Ultralytics tarafından piyasaya sürülen YOLO11 , parametre verimliliği ve özellik çıkarma yeteneğine öncelik veren YOLO önemli bir gelişmeyi YOLO11 . Bazı mimarilerin araştırma odaklı doğasından farklı olarak, YOLO11 gerçek dünya uygulamaları için tasarlanmış YOLO11 , ham doğruluk ile operasyonel hız arasında denge kuruyor.
Mimari Yenilikler
YOLO11 , CSP darboğazının daha hafif ve daha hızlı bir evrimi olan C3k2 bloğunuYOLO11 ve modelin kritik görüntü bölgelerine odaklanmasını geliştirmek için C2PSA'yı (Cross-Stage Partial with Spatial Attention) entegre ediyor. Bu değişiklikler, rekabetçi mAP korurken, önceki yinelemelerden hesaplama açısından daha ucuz bir model ortaya çıkarıyor.
Geliştiriciler için avantajlar şunlardır:
- Daha Az Bellek Kullanımı: YOLO11 , benzer doğruluk için PP-YOLOE+'dan önemli ölçüde daha az parametre YOLO11 (örneğin, YOLO11x, PP-YOLOE+x'ten yaklaşık %42 daha az parametreye sahiptir), bu da onu sınırlı RAM'e sahip uç cihazlar için ideal hale getirir.
- Birleşik Çerçeve: Algılama, segmentasyon, sınıflandırma, poz tahmini ve OBB'yi sorunsuz bir şekilde destekler.
- PyTorch : Yaygın olarak kullanılan PyTorch dayalı olarak geliştirilmiş olup, modern AI araçlarının ve kütüphanelerinin büyük çoğunluğuyla uyumluluk sağlar.
Meta Veriler:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2024-09-27
- GitHub:ultralytics/ultralytics
- Belgeler:YOLO11 Dökümantasyonu
YOLO11 hakkında daha fazla bilgi edinin
Eleştirel Analiz: Doğru Aracı Seçmek
1. Kullanım Kolaylığı ve Ekosistem
Bu noktada ayrım en belirgin şekilde ortaya çıkmaktadır. Ultralytics , aşağıdaki özellikleriyle tanınmaktadır: kullanım kolaylığı. Şunu ultralytics Python , genellikle beş satırdan az kodla eğitim, doğrulama ve dağıtım yapılmasına olanak tanır.
Buna karşılık, PP-YOLOE+ için PaddlePaddle kurulması ve PaddleDetection deposunun kopyalanması gerekir. Yapılandırma genellikle karmaşık YAML dosyalarının değiştirilmesini ve Pythonic API yerine komut satırı komut dosyalarının kullanılmasını içerir, bu da hızlı prototip oluşturmayı yavaşlatabilir.
2. Dağıtım ve Çok Yönlülük
YOLO11 çok yönlülük açısından YOLO11 . Aşağıdaki formatlara kolayca aktarılabilir ONNX, TensorRT, CoreML ve TFLite gibi format TFLite tek bir TFLite . Bu da onu NVIDIA modüllerinden iOS kadar çeşitli donanımlara dağıtım için üstün bir seçim haline getirir.
PP-YOLOE+ dışa aktarılabilirken, bu işlem genellikle Paddle Inference'ı önceliklendirir veya uyumluluk sorunlarına yol açabilecek ara dönüştürme adımları (ör. Paddle2ONNX) gerektirir. Ayrıca, YOLO11 , Oriented Bounding Box (OBB) algılama ve Instance Segmentationgibi daha geniş bir görev yelpazesini kullanıma hazır olarak YOLO11 , PP-YOLOE+ esas olarak algılama odaklı bir mimariye sahiptir.
3. Eğitim Verimliliği
Ultralytics , eğitim verimliliği için optimize edilmiştir ve genellikle daha az CUDA gerektirir ve akıllı önceden ayarlanmış hiperparametreler sayesinde daha hızlı yakınsama sağlar. Ekosistem ayrıca, Comet gibi deney izleme araçlarıyla sorunsuz entegrasyon sağlar. Comet ve Weights & Biasesgibi deney izleme araçlarıyla sorunsuz entegrasyon sağlayarak MLOps yaşam döngüsünü kolaylaştırır.
İleriye Bakış: YOLO26'nın Gücü
En son teknolojiyi arayan geliştiriciler için Ultralytics , YOLO26adlı devrim niteliğinde bir adım attıYOLO11
YOLO26, YOLOv10 ilk kez kullanılan YOLOv10 şimdi üretim için mükemmelleştirilen YOLOv10 uçtan uca NMS bir tasarıma sahiptir. Bu, gerçek zamanlı uygulamalarda genellikle gecikme darboğazı olan Non-Maximum Suppression (NMS) son işlemine olan ihtiyacı ortadan kaldırır.
YOLO26'daki önemli gelişmeler şunlardır:
- %43'e kadar daha hızlı CPU : Dağıtım Odak Kaybı (DFL) kaldırarak ve baş mimarisini optimize ederek, YOLO26 özellikle uç bilgi işlem ve güçlü GPU'ların bulunmadığı ortamlar için ayarlandı.
- MuSGD Optimizer: SGD Muon'un bir karışımı olan (Moonshot AI'nın Kimi K2'sinden esinlenerek geliştirilen) bu optimizer, bilgisayar görüşüne Büyük Dil Modeli (LLM) eğitiminin istikrarını getirerek daha hızlı yakınsama sağlar.
- ProgLoss + STAL: Hava görüntüleme veya kalite kontrol gibi görevler için çok önemli olan küçük nesne algılamayı iyileştiren gelişmiş kayıp fonksiyonları.
- Göreve Özel İyileştirmeler: Daha iyi maske doğruluğu için semantik segmentasyon kaybı ve OBB için özel açı kaybı içerir, sınır kesintilerini giderir.
Öneri
Yeni projeler için YOLO26 önerilen seçimdir. NMS mimarisi, dağıtım süreçlerini önemli ölçüde basitleştirir ve son işlem için IoU ayarlama karmaşıklığını ortadan kaldırır.
YOLO26 hakkında daha fazla bilgi edinin
Uygulama Örneği
Ultralytics basitliğini deneyimleyin. Aşağıdaki kod, bir modeli yüklemeyi ve eğitmeyi gösterir. Model adı dizesini değiştirerek YOLO11 YOLO26 arasında kolayca geçiş yapabilirsiniz.
from ultralytics import YOLO
# Load the latest YOLO26 model (or use "yolo11n.pt")
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The system automatically handles data augmentation and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
# NMS-free output is handled automatically for YOLO26
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for simplified deployment
path = model.export(format="onnx")
Diğer özel mimarilerle ilgilenen kullanıcılar için, belgeler ayrıca aşağıdaki modeller gibi konuları da kapsamaktadır RT-DETR ve açık sözlük görevleri için YOLO gibi modeller de ele alınmaktadır.
Sonuç
PP-YOLOE+, Baidu ekosistemine yoğun bir şekilde yatırım yapanlar için sağlam bir seçenek olmaya devam ederken, YOLO11 ve daha yeni olan YOLO26, genel geliştirici topluluğu için daha cazip bir paket sunmaktadır. Üstün kullanım kolaylığı, daha düşük bellek gereksinimleri, kapsamlı dışa aktarma seçenekleri ve gelişen bir topluluk ile Ultralytics , modern, ölçeklenebilir bilgisayar görme uygulamaları için gerekli performans dengesini sağlar.