YOLOv6.0 ile PP-YOLOE+: Endüstriyel Nesne Algılamanın Optimizasyonu
Gerçek zamanlı nesne algılama alanı, çeşitli donanımlarda yüksek doğruluk ile düşük gecikme süresini dengeleyebilen modellere olan ihtiyaçtan dolayı hızla gelişmiştir. Bu alanı tanımlayan iki önemli mimari, Meituan tarafından endüstriyel uygulamalar için geliştirilen YOLOv6.YOLOv6 ve Baidu'nun PaddlePaddle gelişmiş bir çapa içermeyen model olan PP-YOLOE+'dır.
Bu karşılaştırma, bilgisayar görme projeleriniz için doğru aracı seçmenize yardımcı olmak amacıyla mimari yeniliklerini, performans karşılaştırmalarını ve dağıtım uygunluklarını incelemektedir.
Modele Genel Bakış
YOLOv6-3.0
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş:Meituan
Tarih: 13 Ocak 2023
Bağlantılar:Arxiv | GitHub
Genellikle "Tam Ölçekli Yeniden Yükleme" olarak anılan YOLOv6, endüstriyel uygulamalar için özel olarak tasarlanmış tek aşamalı bir nesne algılayıcıdır. Temel tasarım hedefi, NVIDIA T4 GPU'lar gibi donanımlarda verimi en üst düzeye çıkarmaktır. Hız ve doğruluk sınırlarını zorlamak için Çift Yönlü Yol Toplama Ağı (Bi-PAN) ve Ankraj Destekli Eğitim (AAT) stratejilerini kullanır.
YOLOv6 hakkında daha fazla bilgi edinin.
PP-YOLOE+
Yazarlar: PaddlePaddle
Kuruluş:Baidu
Tarih: 2 Nisan 2022
Bağlantılar:Arxiv | GitHub
PP-YOLOE+, backbone ölçeklenebilir backbone ve göreve uygun başlığı kullananYOLO bir evrimidir. Daha geniş PaddleDetection paketinin bir parçasıdır ve yüksek hassasiyetli, düşük gecikmeli, ankrajsız bir dedektör olmaya odaklanmıştır. PaddlePaddle kullanıldığında, FPGA ve NPU optimizasyonu dahil olmak üzere çeşitli arka uç desteği için PaddleLite'ı kullanarak özellikle güçlüdür.
PP-YOLOE hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Üretim için bir model seçerken, ortalama hassasiyet (mAP) ve çıkarım hızı arasındaki dengeyi anlamak çok önemlidir. Aşağıdaki tablo, bu modellerin çeşitli boyutlarda nasıl karşılaştırıldığını göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Kritik Analiz
- Küçük Model Verimliliği: Nano/küçük ölçekte, PP-YOLOE+t, benzer parametre sayısı için önemli ölçüde daha yüksek doğruluk (39,9% mAP 37,5% mAP) sunar. Ancak, YOLOv6.YOLOv6, GPU'larda gecikme süresi için agresif bir şekilde optimize edilmiştir ve T4'te inanılmaz bir 1,17 ms hızına ulaşır.
- Orta Düzey Denge: Orta ölçekte rekabet kızışıyor. YOLOv6. YOLOv6, doğruluk (50,0% karşı 49,8%) ve hız (5,28 ms karşı 5,56 ms) açısından PP-YOLOE+m'yi biraz geride bırakarak genel amaçlı endüstriyel denetim görevleri için mükemmel bir seçim haline geliyor.
- Büyük Ölçekli Doğruluk: Uydu görüntüsü analizi gibi maksimum ayrıntı gerektiren uygulamalar için PP-YOLOE+, %54,7 mAP ulaşan bir X-large varyantı sunar. Bu, YOLOv6. YOLOv6 bu özel karşılaştırma ölçütünde açıkça eşleşmediği bir boyut kademesidir.
Mimari ve İnovasyon
YOLOv6.0: Endüstri Uzmanı
YOLOv6 , yüksek verimli ortamlar için tasarlanmış birkaç agresif optimizasyon tekniğini YOLOv6 .
- RepBi-PAN: RepVGG tarzı bloklarla donatılmış çift yönlü yol toplama ağı. Bu, modelin eğitim sırasında karmaşık dallanmalara sahip olmasına ancak çıkarım sırasında basit 3x3 konvolüsyonlara birleşmesine olanak tanıyarak bellek erişim maliyetlerini azaltır.
- Anchor-Aided Training (AAT): Model çıkarımında anchor kullanılmasa da, YOLOv6 eğitim sırasında yakınsamayı stabilize etmek için anchor tabanlı bir dal YOLOv6 ve böylece her iki dünyanın en iyi özelliklerini bir araya getirir.
- Ayrıştırılmış Kafa: Yakınsama hızını ve doğruluğu artırmak için modern dedektörlerde standart olan regresyon ve sınıflandırma görevlerini birbirinden ayırır.
PP-YOLOE+: Ankarsız İyileştirme
PP-YOLOE+, özellik temsiline odaklanarak çapa içermeyen paradigmayı geliştirir.
- CSPRepResNet Backbone: Cross Stage Partial ağlarını artık bağlantılarla backbone ölçeklenebilir bir backbone kullanır backbone güçlü bir gradyan akışı sağlar.
- TAL (Görev Uyumlaştırma Öğrenimi): Bu dinamik etiket atama stratejisi, sınıflandırma ve yerelleştirme kalitesinin birleşik puanına göre en yüksek kaliteli bağlantı noktalarının seçilmesini sağlar.
- ET-Head: Görev uyumunun avantajlarından ödün vermeden hız için tahmin katmanlarını optimize eden verimli, görev uyumlu bir başlık.
Donanım Hususları
YOLOv6 , NVIDIA (TensorRT) için büyük ölçüde optimize YOLOv6 ve genellikle T4 ve A100 yongalarında en iyimAP gösterir. PP-YOLOE+, kenar cihazlarda bulunan ARM CPU'lar ve NPU'lar dahil olmak üzere PaddleLite aracılığıyla daha geniş donanım desteğine ihtiyaç duyduğunuzda öne çıkar.
Ultralytics'in Avantajı
YOLOv6 PP-YOLOE+ mükemmel araştırma başarıları olsa da, geliştiriciler kağıt üzerindekinden ürüne geçerken entegrasyon, dağıtım ve bakım konusunda sık sık zorluklarla karşılaşırlar. Ultralytics bu sorunları doğrudan ele alır.
Kullanım Kolaylığı ve Ekosistem
Ultralytics Python , minimum kodla modelleri eğitmenize, doğrulamanıza ve dağıtmanıza olanak tanır. PaddleDetection veya araştırma depolarının sıklıkla gerektirdiği karmaşık yapılandırma dosyalarının aksine, Ultralytics iş akışını Ultralytics .
from ultralytics import YOLO
# Load a model (YOLOv8, YOLO11, or YOLO26)
model = YOLO("yolo26s.pt")
# Train on a custom dataset with a single command
model.train(data="coco8.yaml", epochs=100)
Ayrıca, Ultralytics (eski adıyla HUB), veri kümesi yönetimi, otomatik açıklama ekleme ve tek tıklamayla bulut eğitimi için kod gerektirmeyen bir çözüm sunarak ekiplerin MLOps yaşam döngüsünü kolaylaştırır.
Çok Yönlülük ve Görev Desteği
YOLOv6 PP-YOLOE+ öncelikle nesne algılamaya odaklanmaktadır. Buna karşılık, Ultralytics gibi YOLO11 ve YOLO26 gibi Ultralytics modelleri, tek bir kütüphane içinde bilgisayar görme görevlerinin tüm yelpazesini doğal olarak destekler:
- Örnek Segmentasyonu: Nesnelerin hassas maskelenmesi.
- Poz Tahmini: İnsan veya hayvan takibi için kilit nokta algılama.
- Yönlendirilmiş Sınır Kutusu (OBB): Hava görüntülerinde kritik öneme sahip, döndürülmüş nesneleri algılama.
- Sınıflandırma: Tam görüntü kategorizasyonu.
Eğitim Verimliliği ve Bellek
Ultralytics , verimli bellek kullanımlarıyla tanınır. Mimariyi ve veri yükleyicileri optimize ederek, YOLO26 gibi modeller, eski mimarilere veya RT-DETR gibi dönüştürücü ağırlıklı modellere kıyasla tüketici sınıfı GPU'larda daha büyük parti boyutlarına olanak tanır. RT-DETRgibi transformatör ağırlıklı modellerle karşılaştırıldığında daha büyük parti boyutlarına olanak tanır. Bu sayede, veri merkezi olmasa bile yüksek performanslı yapay zekaya erişilebilir.
Öneri: Neden YOLO26'yı Seçmelisiniz?
2026 yılında yeni projeler başlatan geliştiriciler için Ultralytics , verimlilik ve doğruluk açısından zirveyi temsil ediyor. Önceki nesillerde ve rakip modellerde bulunan belirli sınırlamaları ortadan kaldırıyor:
- Uçtan Uca NMS: NMS Non-Maximum Suppression) son işlem gerektirebilen YOLOv6 PP-YOLOE+'dan farklı olarak, YOLO26 doğal olarak uçtan uca çalışır. Bu, dağıtım mantığını basitleştirir ve kalabalık sahnelerde gecikme değişkenliğini azaltır.
- MuSGD Optimizer: Büyük Dil Modelleri (LLM) alanındaki yeniliklerden esinlenerek geliştirilen bu optimizer, karmaşık özel veri kümeleri için bile istikrarlı bir eğitim sağlar.
- Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) ve diğer ağır bileşenlerin kaldırılmasıyla YOLO26, CPU %43'e varan hız artışı sağlar ve GPU'ların kullanılamadığı mobil ve IoT uygulamaları için üstün bir seçim haline gelir.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, genel amaçlı dedektörlerin geleneksel zayıf noktası olan küçük nesne algılamada önemli artışlar sağlar.
YOLO26 hakkında daha fazla bilgi edinin
Sonuç
Hem YOLOv6.YOLOv6 hem de PP-YOLOE+, nesne algılama tarihinde önemli roller oynamaktadır. Altyapınız NVIDIA sıkı bir şekilde bağlantılıysa ve endüstriyel denetim için verimi en üst düzeye çıkarmak istiyorsanız YOLOv6.YOLOv6 seçin. Baidu PaddlePaddle derinlemesine entegreyseniz veya Çin donanım hızlandırıcıları için özel destek gerekiyorsa PP-YOLOE+'yı seçin.
Ancak, görevler arasında çok yönlülük, kullanım kolaylığı ve hem CPU GPU en son teknoloji performansı sunan, geleceğe dönük bir çözüm için Ultralytics önerilen seçimdir. Ultralytics ile entegrasyonu, ortamları yapılandırmak için daha az zaman harcamanızı ve gerçek dünyadaki sorunları çözmek için daha fazla zaman ayırmanızı sağlar.
Daha Fazla Okuma
- YOLOv8: Endüstride yaygın olarak kullanılan klasik ve son teknoloji model.
- YOLOv10: NMS eğitim stratejilerinin öncüsü.
- RT-DETR: Yüksek doğruluklu senaryolar için Gerçek Zamanlı Algılama Dönüştürücü.
- YOLO : Özel eğitim gerektirmeden nesneleri bulmak için açık sözlük algılama.