PP-YOLOE+ ve YOLOv7: Gerçek Zamanlı Nesne Algılama Mimarilerinde Yolunuzu Bulmak
Bilgisayarlı görü işlem hatları oluştururken, doğru nesne algılama modelini seçmek kritiktir. 2022'den iki önemli mimari olan PP-YOLOE+ ve YOLOv7, gerçek zamanlı nesne algılamada güçlü ilerlemeler getirdi. Bu teknik karşılaştırma, uygulamalarınız için bilinçli kararlar vermenize yardımcı olmak adına mimarilerine, eğitim metodolojilerine ve gerçek dünya performanslarına derinlemesine bir bakış sağlar.
Modellere Genel Bakış
Hem PP-YOLOE+ hem de YOLOv7, doğruluk ve hız sınırlarını zorlamak için tasarlanmıştır, ancak farklı geliştirme ekosistemlerinden ve tasarım felsefelerinden gelirler.
PP-YOLOE+
Baidu'daki PaddlePaddle yazarları tarafından geliştirilen PP-YOLOE+, orijinal PP-YOLOv2 üzerine inşa edilmiştir. PaddlePaddle ekosistemi için optimize edilmiş, verimli ve yüksek doğruluklu bir nesne dedektörü sağlamak amacıyla tanıtılmıştır.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş: Baidu
- Tarih: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddleDetection Deposu
- Dokümantasyon: PP-YOLOE+ Dokümantasyonu
PP-YOLOE+ hakkında daha fazla bilgi edin
YOLOv7
Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından geliştirilen YOLOv7, piyasaya sürüldüğü dönemde gerçek zamanlı nesne dedektörleri için yeni son teknoloji kıyaslamalar belirlemek üzere "eğitilebilir ücretsiz hediyeler" (trainable bag-of-freebies) kavramını tanıttı.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Organizasyon: Institute of Information Science, Academia Sinica, Tayvan
- Tarih: 2022-07-06
- Arxiv: 2207.02696
- GitHub: YOLOv7 Deposu
- Dokümanlar: Ultralytics YOLOv7 Dokümanları
YOLOv7 hakkında daha fazla bilgi edinin
Mimari Yenilikler
PP-YOLOE+ Mimarisi
PP-YOLOE+, büyük ölçüde anchor-free (çapa-olmayan) bir paradigmaya dayanır ve özel veri kümeleri için çapa kutularını ayarlama ihtiyacını ortadan kaldırarak dağıtım sürecini daha basit hale getirir. Etkili çok ölçekli özellik füzyonu için güçlü bir RepResNet omurgası ve CSPNet tarzı bir PAN (Yol Toplama Ağı) içerir. Ayrıca, eğitim sırasında sınıflandırma ve yerelleştirme görevlerini dinamik olarak hizalamak için Görev Hizalama Öğrenimi (TAL) kavramından yararlanarak çeşitli bilgisayarlı görü görevlerinde yüksek doğruluk sağlar.
YOLOv7 Mimarisi
YOLOv7, Genişletilmiş Verimli Katman Toplama Ağı'nı (E-ELAN) tanıtarak farklı bir yaklaşım benimsedi. Bu mimari, ağın orijinal gradyan yolunu bozmadan daha çeşitli özellikleri öğrenmesini sağlayarak daha iyi yakınsama sağlar. YOLOv7 ayrıca, yürütmeyi hızlandırmak için çıkarım sırasında evrişimsel katmanları birleştiren -özellikle planlanmış yeniden parametrelendirilmiş evrişimler- model yeniden parametrelendirmesini yoğun bir şekilde kullanır. Bu, YOLOv7'yi çoklu nesne takibi ve karmaşık güvenlik alarm sistemleri gibi görevlerde son derece güçlü kılar.
Performans Analizi
Hız, parametreler ve doğruluk (mAP) dengelenirken, modeller belirli varyanta ve hedef donanıma bağlı olarak farklı avantajlar sağlar. Aşağıda metriklerinin kapsamlı bir karşılaştırması yer almaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
PP-YOLOE+x modeli biraz daha yüksek mAP elde etse de, YOLOv7 varyantları çok güçlü bir parametre-doğruluk oranı sunar. YOLOv7 mimarisi, TensorRT optimizasyonunun son derece düşük gecikme sağladığı ham GPU işlemleri için favori olmaya devam ediyor.
Ultralytics Avantajı
Bu modelleri eğitirken ve dağıtırken, seçtiğin çerçeve modelin kendisi kadar önemlidir. Ultralytics kullanmak, tüm makine öğrenimi yaşam döngüsünü basitleştiren oldukça birleşik bir Python API sayesinde kolaylaştırılmış bir kullanıcı deneyimi sağlar.
- İyi Korunan Ekosistem: Ultralytics YOLO modelleri, sürekli güncellenen bir ekosistemden, güçlü dokümantasyondan ve aktif bir topluluktan yararlanır.
- Bellek Gereksinimleri: Ultralytics, veri yüklemeyi ve eğitim rejimlerini yoğun bir şekilde optimize eder. Ultralytics YOLO modellerini eğitmek, genellikle ağır transformer tabanlı mimarilere kıyasla çok daha az CUDA belleği gerektirir ve geliştiricilerin tüketici sınıfı donanımlarda daha büyük toplu boyutları kullanmalarına olanak tanır.
- Eğitim Verimliliği: Sağlam veri artırma stratejilerinden ve yerleşik hiperparametre ayarından yararlanan Ultralytics, modellerin hazır önceden eğitilmiş ağırlıklarla hızlı bir şekilde yakınsamasını sağlar.
Basit API Uygulaması
Ultralytics ile bir YOLOv7 modelini eğitmek, karmaşık eğitim betiklerini tamamen soyutlayarak sadece birkaç satır kod alır:
from ultralytics import YOLO
# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to TensorRT for deployment
model.export(format="engine", device=0)Yeni Standart: YOLO26 ile Tanışın
PP-YOLOE+ ve YOLOv7, nesne algılamada birer dönüm noktası olsa da, yapay zeka dünyası hızla gelişiyor. Herhangi bir yeni bilgisayarlı görü projesi için Ultralytics YOLO26 kullanmanı şiddetle tavsiye ederiz. Ocak 2026'da piyasaya sürülen YOLO26, uç odaklı yapay zekada dev bir sıçramayı temsil ediyor.
YOLO26 Neden Eski Mimarilerden Daha İyi Performans Gösterir:
- Uçtan Uca NMS-Olmayan Tasarım: YOLO26 yerel olarak uçtan ucadır. Maksimum Olmayan Baskılama (NMS) sonrası işlemeyi ortadan kaldırarak, YOLOv10 içinde ilk kez görülen bir atılım olan tahmin edilebilir, deterministik bir çıkarım gecikmesini garanti eder.
- DFL Kaldırılması: Dağılım Odaklı Kaybın (Distribution Focal Loss) kaldırılması, dışa aktarma sürecini basitleştirir ve düşük güçlü uç cihazlar için uyumluluğu önemli ölçüde artırır.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Akıllı şehir IoT sensörleri gibi özel GPU'ların bulunmadığı senaryolar için YOLO26, doğrudan CPU'larda verimli bir şekilde çalışacak şekilde yoğun bir şekilde optimize edilmiştir.
- MuSGD Optimize Edici: Gelişmiş LLM eğitim tekniklerinden (Moonshot AI'nın Kimi K2'si gibi) esinlenen YOLO26, inanılmaz derecede kararlı eğitim ve hızlı yakınsama için SGD ve Muon'un bir hibritini kullanır.
- ProgLoss + STAL: Bu geliştirilmiş kayıp fonksiyonları, drone hava görüntüleri ve üretim hata tespiti gibi kullanım durumları için hayati önem taşıyan küçük nesne algılamada kayda değer kazanımlar sağlar.
YOLO26 hakkında daha fazla bilgi edin
İdeal Kullanım Durumları ve Dağıtım Senaryoları
PP-YOLOE+ ne zaman kullanılmalı?
PP-YOLOE+, Baidu ve PaddlePaddle ekosisteminde derinlemesine yer aldığında parlar. Dağıtım hedefin Paddle modelleri için uyarlanmış özel donanımlar kullanıyorsa (örneğin belirli Asya üretim hatlarında), PP-YOLOE+ mükemmel doğruluk ve sorunsuz entegrasyon sağlar. Endüstriyel üretim otomasyonu için oldukça etkilidir.
Ne zaman YOLOv7 kullanılmalı
YOLOv7, özellikle TensorRT kullanan NVIDIA donanımlarında dağıtım yaparken genel yüksek performanslı çıkarım için mükemmel bir seçim olmaya devam ediyor. PyTorch ekosistemine entegrasyonu, onu akademik araştırmalar ve gerçek zamanlı kalabalık yönetimi veya ağın yapısal bütünlüğünün çok önemli olduğu karmaşık poz tahmini görevleri gibi özel ticari hatlar için çok yönlü kılar.
Dikkate Alınabilecek Diğer Modeller
Tam ihtiyaçlarına bağlı olarak, bu mimarileri geniş, üretim için hazır esneklik için YOLO11 veya projenin geleneksel evrişimsel ağlara göre görme transformer'larının belirli avantajlarını gerektirmesi durumunda RT-DETR ile karşılaştırmak isteyebilirsin.
Sonuç
Hem PP-YOLOE+ hem de YOLOv7, gerçek zamanlı nesne algılama dünyasına önemli iyileştirmeler getirdi. PP-YOLOE+ PaddlePaddle çevresinde standartlaştırılmış ortamlarda başarılı olurken, YOLOv7 PyTorch ve Ultralytics ekosistemleri aracılığıyla inanılmaz esneklik ve performans sunuyor.
Ancak, bilgisayarlı görü çözümleri ilerlemeye devam ettikçe, modern araçları kullanmak çok önemlidir. Ultralytics Platform ve YOLO26 gibi yeni nesil mimarileri benimseyerek, geliştiriciler uygulamalarının hız, doğruluk ve kullanım kolaylığı açısından en ileri seviyede kalmasını sağlayabilirler.