Nesne Algılamada Yolunuzu Bulun: PP-YOLOE+ ile YOLOv6-3.0 Karşılaştırması
Gerçek zamanlı bilgisayarlı görü alanı hızla genişledi ve bu da farklı dağıtım senaryoları için optimize edilmiş, oldukça özelleşmiş mimarilere yol açtı. Geliştiriciler, yüksek verim ile güvenilir doğruluk dengesi gerektiren uygulamalar oluştururken sıklıkla PP-YOLOE+ ve YOLOv6-3.0 modellerini karşılaştırır. Her iki model de piyasaya sürüldüklerinde, endüstriyel ve uç (edge) uygulamalar için çıkarım hızlarını artırmaya odaklanarak önemli mimari iyileştirmeleri beraberinde getirdi.
Ayrıntılı mimari analizlere girmeden önce, bu modellerin hız ve doğruluk açısından birbirlerine göre nasıl performans gösterdiğini görselleştirmek için aşağıdaki grafiği incele.
PP-YOLOE+: Mimari Güçlü ve Zayıf Yönler
PaddlePaddle Yazarları tarafından geliştirilen PP-YOLOE+, çeşitli ölçek gereksinimlerinde güçlü bir performans sunmak için öncülerinin üzerine inşa edilmiş önde gelen bir çapasız (anchor-free) dedektördür.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş: Baidu
- Tarih: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
Mimari Öne Çıkanlar
PP-YOLOE+, orijinal PP-YOLOE tasarımına göre birkaç kritik geliştirme getirdi. Hesaplama maliyeti ile özellik çıkarma yeteneklerini verimli bir şekilde dengeleyen güçlü bir CSPRepResNet omurgasından yararlanır. Ayrıca, çok ölçekli özellik füzyonunu sağlamak için bir Yol Birleştirme Ağı (PAN) ile birleştirilmiş gelişmiş bir özellik piramidi ağı (FPN) içerir. En dikkat çekici özelliklerinden biri, nesne algılama sırasında sınıflandırma ve yerelleştirme koordinasyonunu önemli ölçüde iyileştiren ET-head (Verimli Görev uyumlu başlık) yapısıdır.
PP-YOLOE+ etkileyici bir ortalama hassasiyet (mAP) elde etse de, PaddlePaddle ekosistemine bağımlılığı, PyTorch tabanlı iş akışlarına alışkın araştırmacılar için bazen dik bir öğrenme eğrisi oluşturabilir. Bu durum, doğrudan Paddle çıkarım desteğinden yoksun heterojen uç cihazları hedeflediğinde model dağıtımı sürecini biraz karmaşıklaştırabilir.
PP-YOLOE+, Baidu'nun teknoloji yığını içinde dağıtım için yüksek düzeyde optimize edilmiştir, bu da üretim ortamın büyük ölçüde Paddle çıkarım araçlarına dayanıyorsa onu mükemmel bir seçim haline getirir.
PP-YOLOE+ hakkında daha fazla bilgi edin
YOLOv6-3.0: Endüstriyel İş Hacmi
Meituan Vision AI Departmanı tarafından yayınlanan YOLOv6-3.0, özellikle GPU donanımında devasa verimliliğe öncelik vererek endüstriyel uygulamalar için yeni nesil bir nesne dedektörü olarak hizmet vermek üzere açıkça tasarlandı.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, ve diğerleri.
- Kuruluş: Meituan
- Tarih: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Mimari Öne Çıkanlar
YOLOv6-3.0, özellikle TensorRT kullanan NVIDIA GPU'larda donanım kullanımını en üst düzeye çıkarmak için özel olarak uyarlanmış verimli bir EfficientRep omurgasına sahiptir. v3.0 güncellemesi, parametre sayısını aşırı şişirmeden uzamsal özellik korumasını artıran çift yönlü bir birleştirme (BiC) modülünü ağ kısmına getirdi. Ek olarak, model eğitimi sırasında çapa tabanlı kararlılığın avantajlarını birleştirirken gerçek zamanlı çıkarım sırasında hızlı, çapasız bir mimariyi koruyan bir Çapa Destekli Eğitim (AAT) stratejisi sundu.
Ancak, YOLOv6-3.0 sunucu sınıfı GPU'lar için yüksek düzeyde optimize edildiğinden, ağır kısıtlamalara sahip, sadece CPU kullanılan uç cihazlarda dağıtıldığında gecikme kazanımları bazen azalır. Bu uzmanlaşma, çevrimdışı video analitiği gibi ortamlarda mükemmel olduğu ancak daha küçük, yerelleştirilmiş donanımlarda dinamik olarak optimize edilmiş modellerin gerisinde kalabileceği anlamına gelir.
YOLOv6 hakkında daha fazla bilgi edinin
Performans Karşılaştırma Tablosu
Aşağıdaki tablo, her iki mimarinin farklı ölçek varyantlarını doğrudan karşılaştırarak temel performans metriklerini vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Kullanım Durumları ve Öneriler
PP-YOLOE+ ile YOLOv6 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
PP-YOLOE+ Ne Zaman Seçilmeli
PP-YOLOE+ şunlar için güçlü bir tercihtir:
- PaddlePaddle Ekosistemi Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip kuruluşlar.
- Paddle Lite Uç Dağıtımı: Paddle Lite veya Paddle çıkarım motoru için özel olarak optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım yaparken.
- Yüksek Doğruluklu Sunucu Tarafı Algılama: Çerçeve bağımlılığının bir sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğuna öncelik veren senaryolar.
YOLOv6 Ne Zaman Seçilmeli?
YOLOv6 şunlar için önerilir:
- Endüstriyel Donanım Odaklı Dağıtım: Modelin donanım odaklı tasarımının ve verimli yeniden parametrelendirmenin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
- Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU'da ham çıkarım hızına öncelik veren uygulamalar.
- Meituan Ekosistem Entegrasyonu: Hali hazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics Avantajı: Eski Modellerin Ötesine Geçmek
PP-YOLOE+ ve YOLOv6-3.0 hedefe yönelik çözümler sunarken, modern yapay zeka geliştirme süreçleri çok yönlü, bellek açısından verimli iş akışları gerektirir. İşte Ultralytics Platformu burada benzersiz bir geliştirici deneyimi sunar. Birleşik bir Python API ile, eski araştırma depolarında yaygın olarak bulunan devasa yapılandırma yükü olmadan en son teknoloji modelleri sorunsuz bir şekilde eğitebilir, doğrulayabilir ve dağıtabilirsin.
Ultralytics models natively support a wide array of vision tasks beyond standard detection, including instance segmentation, pose estimation, image classification, and Oriented Bounding Box (OBB) extraction. Furthermore, they are highly optimized for lower memory usage during training—a stark contrast to transformer-based models like RT-DETR which generally demand massive GPU VRAM allocations.
YOLO26 ile Tanış: Yeni Standart
En gelişmiş görü modellerini dağıtmak isteyen kuruluşlar için, (Ocak 2026'da yayınlanan) Ultralytics YOLO26 performans sınırlarını yeniden tanımlıyor. Birkaç kritik yenilikle eski nesillerden önemli ölçüde daha iyi performans gösterir:
- End-to-End NMS-Free Design: Building on concepts from YOLOv10, YOLO26 completely eliminates Non-Maximum Suppression (NMS) post-processing. This natively end-to-end approach guarantees predictable, ultra-low latency inference, crucial for real-time safety systems.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Mimariden Dağılım Odak Kaybının (DFL) kaldırılması sayesinde YOLO26, uç bilişim ve özel GPU hızlandırmasından yoksun ortamlar için radikal bir şekilde optimize edilmiştir.
- MuSGD Optimize Edici: LLM eğitim kararlılığını görü modellerine entegre eden bu hibrit optimize edici (Moonshot AI'dan ilham almıştır), hızlı yakınsama ve oldukça kararlı özel eğitim oturumları sağlar.
- ProgLoss + STAL: Bu gelişmiş kayıp formülasyonları, hava drone görüntüleri ve kalabalık sahne analizi gibi uygulamalar için hayati önem taşıyan küçük nesne tanımada dikkate değer iyileştirmeler sağlar.
Bugün yeni bir proje inşa ediyorsan, eski mimarileri atlamanı ve YOLO26'yı benimsemeni şiddetle tavsiye ederiz. Bellek verimliliği ve NMS'siz hızı, üretime geçişi önemli ölçüde kolaylaştırır.
Sorunsuz Uygulama
Ultralytics Python paketi kullanarak en son teknoloji modelleri eğitmek ve dışa aktarmak son derece basittir. Aşağıdaki örnek, en son YOLO26 modelini nasıl eğiteceğini ve hızlı uç dağıtımı için ONNX'e nasıl aktaracağını göstermektedir:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for edge deployment
model.export(format="onnx")Eski iş akışlarına derinden bağlı ancak modern kararlılık arayan ekipler için, tam Ultralytics ekosistemi tarafından desteklenen kapsamlı görev çeşitliliği sunan Ultralytics YOLO11 keşfetmek de mükemmel bir geçiş adımıdır.