Nesne Algılama Navigasyonu: PP-YOLOE+ ile YOLOv6.0 Karşılaştırması
Gerçek zamanlı bilgisayar görme alanı hızla genişleyerek, çeşitli dağıtım senaryoları için optimize edilmiş son derece özel mimarilere yol açmıştır. Geliştiriciler, yüksek verim ve güvenilir doğruluk dengesi gerektiren uygulamalar oluştururken sık sık PP-YOLOE+ ve YOLOv6.YOLOv6 karşılaştırır. Her iki model de piyasaya sürüldüklerinde, endüstriyel ve uç uygulamalar için çıkarım hızlarını artırmaya odaklanarak önemli mimari iyileştirmeler getirmiştir.
Ayrıntılı mimari analizlere geçmeden önce, aşağıdaki tabloyu inceleyerek bu modellerin hız ve doğruluk açısından birbirlerine göre nasıl bir performans sergilediklerini görselleştirin.
PP-YOLOE+: Mimari Güçlü ve Zayıf Yönleri
PaddlePaddle Yazarları tarafından geliştirilen PP-YOLOE+, çeşitli ölçek gereksinimlerinde sağlam performans sunmak üzere öncülleri üzerine inşa edilmiş öne çıkan bir anchor-free detector’dır.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş: Baidu
- Tarih: 2022-04-02
- Arxiv:2203.16250
- GitHub:PaddlePaddle/PaddleDetection
Mimari Öne Çıkanlar
PP-YOLOE+, orijinal PP-YOLOE tasarımına göre birkaç kritik iyileştirme sunmuştur. Hesaplama maliyetini özellik çıkarma yetenekleriyle verimli bir şekilde dengeleyen güçlü bir CSPRepResNet backbone kullanır. Ayrıca, çok ölçekli özellik füzyonunu sağlamak için bir Path Aggregation Network (PAN) ile birleştirilmiş gelişmiş bir özellik piramit ağı (FPN) içerir. Öne çıkan özelliklerinden biri, nesne detect sırasında sınıflandırma ve lokalizasyon koordinasyonunu önemli ölçüde iyileştiren ET-head (Efficient Task-aligned head) yapısıdır.
PP-YOLOE+ etkileyici bir ortalama hassasiyet (mAP) elde etse de, PaddlePaddle ekosistemine bağımlılığı, PyTorch tabanlı iş akışlarına alışkın araştırmacılar için bazen dik bir öğrenme eğrisi sunabilir. Bu durum, doğrudan Paddle çıkarım desteği olmayan heterojen kenar cihazları hedeflendiğinde model dağıtım sürecini biraz karmaşıklaştırabilir.
Dağıtım Bağlamı
PP-YOLOE+, Baidu'nun teknoloji yığını içinde dağıtım için yüksek düzeyde optimize edilmiştir ve üretim ortamınız Paddle çıkarım araçlarına yoğun bir şekilde güveniyorsa mükemmel bir seçimdir.
PP-YOLOE+ hakkında daha fazla bilgi edinin
YOLOv6-3.0: Endüstriyel Verim
Meituan Vision AI Departmanı tarafından yayınlanan YOLOv6-3.0, endüstriyel uygulamalar için yeni nesil bir nesne detect olarak hizmet vermek üzere, GPU donanımında yüksek verimi önceliklendirerek özel olarak tasarlanmıştır.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, ve diğerleri.
- Kuruluş:Meituan
- Tarih: 2023-01-13
- Arxiv:2301.05586
- GitHub:meituan/YOLOv6
Mimari Öne Çıkanlar
YOLOv6-3.0, özellikle TensorRT kullanan NVIDIA GPU'larda donanım kullanımını en üst düzeye çıkarmak için özel olarak tasarlanmış bir EfficientRep backbone'a sahiptir. v3.0 güncellemesi, parametre sayısını önemli ölçüde artırmadan uzamsal özellik tutulmasını artıran bir Çift Yönlü Birleştirme (BiC) modülünü boyun kısmına getirmiştir. Ek olarak, model eğitimi sırasında anchor tabanlı kararlılığın faydalarını birleştiren ve gerçek zamanlı çıkarım sırasında hızlı, anchor-free bir mimariyi koruyan bir Anchor Destekli Eğitim (AAT) stratejisi sunmuştur.
Ancak, YOLOv6-3.0 sunucu sınıfı GPU'lar için yüksek düzeyde optimize edildiğinden, ağır kısıtlamalı, yalnızca CPU'lu kenar cihazlarda dağıtıldığında gecikme kazanımları bazen azalır. Bu uzmanlaşma, çevrimdışı video analizi gibi ortamlarda üstün olduğu, ancak daha küçük, yerelleştirilmiş donanımlarda dinamik olarak optimize edilmiş modellerin gerisinde kalabileceği anlamına gelir.
YOLOv6 hakkında daha fazla bilgi edinin.
Performans Karşılaştırma Tablosu
Aşağıdaki tablo, her iki mimarinin farklı ölçek varyantlarını doğrudan karşılaştırarak temel performans metriklerini vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Kullanım Durumları ve Öneriler
PP-YOLOE+ ve YOLOv6 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.
Ne Zaman PP-YOLOE+ Seçmeli
PP-YOLOE+ için güçlü bir seçenektir:
- PaddlePaddle Ekosistem Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip kuruluşlar.
- Paddle Lite Kenar Dağıtımı: Özellikle Paddle Lite veya Paddle çıkarım motoru için yüksek düzeyde optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım.
- Yüksek Doğruluklu Sunucu Taraflı Algılama: Çerçeve bağımlılığının sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğunu önceliklendiren senaryolar.
YOLOv6 Ne Zaman Tercih Edilmeli?
YOLOv6 şunlar için önerilir:
- Endüstriyel Donanım Farkındalıklı Dağıtım: Modelin donanım farkındalıklı tasarımının ve verimli yeniden parametrelendirmesinin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
- Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU üzerinde ham çıkarım hızına öncelik veren uygulamalar.
- Meituan Ekosistem Entegrasyonu: Halihazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics Avantajı: Eski Modellerin Ötesine Geçmek
PP-YOLOE+ ve YOLOv6-3.0 hedefe yönelik çözümler sunsa da, modern yapay zeka geliştirme, çok yönlü, bellek açısından verimli iş akışları gerektirir. İşte bu noktada Ultralytics Platformu eşsiz bir geliştirici deneyimi sunar. Birleşik bir Python API'si ile, eski araştırma depolarında tipik olarak bulunan büyük yapılandırma yükü olmadan son teknoloji modelleri sorunsuz bir şekilde eğitebilir, doğrulayabilir ve dağıtabilirsiniz.
Ultralytics modelleri, standart detect'in ötesinde çok çeşitli görme görevlerini doğal olarak destekler; bunlar arasında örnek segment, poz tahmini, görüntü sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) çıkarımı bulunur. Ayrıca, eğitim sırasında daha düşük bellek kullanımı için yüksek düzeyde optimize edilmişlerdir; bu durum, genellikle büyük GPU VRAM tahsisleri gerektiren RT-DETR gibi transformer tabanlı modellerle keskin bir tezat oluşturur.
YOLO26'yı keşfedin: Yeni Standart
En üst düzey, son teknoloji görme modellerini dağıtmak isteyen kuruluşlar için Ultralytics YOLO26 (Ocak 2026'da yayınlandı) performans sınırlarını yeniden tanımlıyor. Birkaç kritik inovasyonla eski nesilleri önemli ölçüde geride bırakıyor:
- Uçtan Uca NMS-Free Tasarım: YOLOv10'dan alınan konseptler üzerine inşa edilen YOLO26, Non-Maximum Suppression (NMS) son işlemeyi tamamen ortadan kaldırır. Bu doğal uçtan uca yaklaşım, gerçek zamanlı güvenlik sistemleri için kritik olan öngörülebilir, ultra düşük gecikmeli çıkarımı garanti eder.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Mimariden Distribution Focal Loss (DFL) çıkarılmasıyla, YOLO26 kenar bilişim ve özel GPU hızlandırması olmayan ortamlar için radikal bir şekilde optimize edilmiştir.
- MuSGD Optimize Edici: LLM eğitim kararlılığını görme modellerine entegre eden bu hibrit optimize edici (Moonshot AI'dan esinlenilmiştir), hızlı yakınsama ve yüksek düzeyde kararlı özel eğitim oturumları sağlar.
- ProgLoss + STAL: Bu gelişmiş kayıp formülasyonları, küçük nesne tanımada dikkat çekici iyileştirmeler sunar ve hava drone görüntüleri ile kalabalık sahne analizi gibi uygulamalar için hayati öneme sahiptir.
İş Akışlarınızı Geleceğe Hazırlayın
Bugün yeni bir proje geliştiriyorsanız, eski mimarileri atlamanızı ve YOLO26'yı benimsemenizi şiddetle tavsiye ederiz. Bellek verimliliği ve NMS-free hızı, onu üretime taşımayı önemli ölçüde kolaylaştırır.
Sorunsuz Uygulama
Ultralytics Python paketi kullanarak son teknoloji modelleri eğitmek ve dışa aktarmak oldukça basittir. Aşağıdaki örnek, en son YOLO26 modelini nasıl eğiteceğinizi ve hızlı kenar dağıtımı için ONNX'e nasıl dışa aktaracağınızı göstermektedir:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for edge deployment
model.export(format="onnx")
Eski iş akışlarına derinlemesine entegre olmuş ancak modern kararlılık arayan ekipler için, Ultralytics YOLO11'i keşfetmek de tüm Ultralytics ekosistemi tarafından desteklenen kapsamlı görev çok yönlülüğü sunan mükemmel bir geçiş adımıdır.