YOLOv7 PP-YOLOE+: Gerçek Zamanlı Nesne Algılamada Mimari Karşılaştırma
Bilgisayar görüşünün manzarası sürekli yeniliklerle şekilleniyor ve 2022, iki çok etkili mimarinin piyasaya sürüldüğü önemli bir yıl oldu: YOLOv7 ve PP-YOLOE+. YOLOv7 , "bag-of-freebies" optimizasyonuna odaklanarak YOLO mirasını YOLOv7 , PP-YOLOE+ Baidu'nun PaddlePaddle yüksek performanslı, ankrajsız algılama yönündeki çabasını temsil etti.
Araştırmacılar ve mühendisler için, bu modeller arasında seçim yapmak genellikle belirli çerçeve gereksinimlerine (PyTorch . PaddlePaddle) ve dağıtım donanımına bağlıdır. Bu kılavuz, mimarileri, performans ölçütleri ve kullanılabilirlikleri hakkında derinlemesine teknik bir karşılaştırma sunarken, aynı zamanda bu öncüllerin en iyi özelliklerini sorunsuz, uçtan uca NMS bir çerçeve içinde birleştiren YOLO26 gibi modern alternatifleri de tanıtmaktadır.
Performans Metriklerinin Karşılaştırılması
Aşağıdaki tablo, çeşitli model ölçeklerinde YOLOv7 PP-YOLOE+'nın performansını karşılaştırmaktadır. YOLOv7 sağlam algılama yetenekleri YOLOv7 , PP-YOLOE+ parametre sayısı ve çıkarım hızı arasında oldukça rekabetçi bir denge sunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi
2022 ortasında piyasaya sürülen YOLOv7 , mimari verimlilik ve çıkarım maliyetini artırmayan eğitim optimizasyon stratejilerine odaklanarak nesne algılama sınırlarını YOLOv7 .
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
- Tarih: 2022-07-06
- Bağlantılar:ArXiv Makalesi | GitHub Deposu
Temel Mimari Özellikler
YOLOv7 , en kısa ve en uzun gradyan yollarını kontrol etmek için tasarlanmış yeni bir mimari olan E-ELAN'ı (Extended Efficient Layer Aggregation Network)YOLOv7 . Bu mimari, ağın daha çeşitli özellikleri öğrenmesini sağlıyor. Ayrıca, modelin yeniden parametrelendirilmesi ve dinamik etiket ataması dahil olmak üzere "eğitilebilir bag-of-freebies"i yoğun bir şekilde kullandı.
Ancak, YOLOv7 çapa tabanlı bir dedektördür. Bu metodoloji kanıtlanmış olsa da, genellikle özel veri kümeleri için çapa kutularının dikkatli bir şekilde ayarlanmasını gerektirir, bu da YOLOv8 veya YOLO26'da bulunan daha yeni çapa içermeyen uygulamalara kıyasla eğitim sürecini karmaşıklaştırabilir.
YOLOv7 hakkında daha fazla bilgi edinin.
PP-YOLOE+: Anchor'suz Meydan Okuyucu
PP-YOLOE+, Baidu tarafından PaddleDetection paketinin bir parçası olarak geliştirilen PP-YOLOE'nin bir evrimidir. Çeşitli donanımlarda çıkarım hızını en üst düzeye çıkarırken, bağlantı noktası tabanlı yöntemlerin sınırlamalarını gidermek için tasarlanmıştır.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş:Baidu
- Tarih: 2022-04-02
- Bağlantılar:ArXiv Makalesi | GitHub Deposu
Temel Mimari Özellikler
PP-YOLOE+ kullanır demirsiz paradigma, hiperparametrelerin sayısını önemli ölçüde azaltır. Çekirdeği, RepResBlock (RepVGG'den esinlenerek) ve bir Görev Uyumlaştırma Öğrenimi (TAL) sınıflandırma ve yerelleştirme görevlerini dinamik olarak uyumlu hale getiren strateji. Bu, özellikle x (ekstra büyük) ölçekte etkileyici bir sonuç elde eder. %54,7 mAP.
Ekosistem Değerlendirmeleri
PP-YOLOE+ mükemmel performans sunarken, PaddlePaddle çerçevesi PyTorch bir şekilde PyTorch alışkın geliştiriciler, bu modelleri mevcut PyTorch MLOps boru hatlarına entegre etmeye çalışırken veya TorchScriptgibi standart dağıtım araçlarını kullanırken zorluklarla karşılaşabilirler.
Karşılaştırma: Mimari ve Kullanılabilirlik
Anchor Tabanlı - Anchorsız Karşılaştırması
En belirgin fark, sınırlayıcı kutulara yaklaşımlarında yatmaktadır. YOLOv7 , nesneleri algılamak için referans şablonu görevi gören önceden tanımlanmış bağlantı kutuları kullanır. Bu, COCO gibi standart veri kümeleri için iyi sonuç verir, ancak DOTA-v2 gibi veri kümelerinde bulunan düzensiz nesne şekilleriyle manuel olarak döndürülmedikçe sorun yaşayabilir.
PP-YOLOE+, çapa içermez ve nesnelerin merkezini ve sınırlara olan mesafelerini doğrudan tahmin eder. Bu, genel olarak eğitim sürecini basitleştirir. YOLO11 gibi modern Ultralytics YOLO11 ve YOLO26 gibi modern Ultralytics modelleri de esnekliği ve hızı en üst düzeye çıkarmak için çapa içermeyen ve hatta NMS mimarileri tamamen benimsemiştir.
Bellek ve Verimlilik
Ultralytics , eğitim verimlilikleriyle ünlüdür. YOLOv7 , E-ELAN'daki karmaşık birleştirme yolları nedeniyle en büyük modelleri için önemli miktarda GPU YOLOv7 , PP-YOLOE+ bunu yeniden parametrelendirme yoluyla optimize eder. Ancak, YOLO26 gibi daha yeni versiyonlar, Dağıtım Odak Kaybı (DFL) gibi ağır bileşenleri kaldırarak her ikisini de geride bırakır ve hem eğitim hem de çıkarım sırasında bellek gereksinimlerini önemli ölçüde azaltır.
Gelecek: Neden YOLO26'ya geçmelisiniz?
YOLOv7 PP-YOLOE+ 2022 yılında en son teknolojiyi temsil ederken, bu alan hızla gelişmiştir. Ultralytics tarafından Ocak Ultralytics piyasaya sürülen YOLO26, önceki modellerin belirli sorunlarını ele alarak bu gelişmelerin doruk noktasını temsil etmektedir.
Uçtan Uca NMS'siz Tasarım
YOLOv7 PP-YOLOE+'da en büyük darboğazlardan biri, yinelenen algılamaları filtrelemek için gerekli olan bir son işlem adımı olan Maksimum Dışı Bastırma (NMS)dır. YOLO26, doğal olarak uçtan uca NMS. Bu, kalabalık NMS neden olduğu gecikme değişkenliğini ortadan kaldırarak, otonom araçlar ve trafik izleme gibi gerçek zamanlı uygulamalar için ideal hale getirir.
Edge Computing için optimize edilmiştir
YOLO26, Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasını içerir. Bu mimari sadeleştirme, aşağıdaki formatlara dışa aktarma sürecini kolaylaştırır CoreML ve TFLitegibi formatlara aktarım sürecini kolaylaştırarak düşük güç tüketen cihazlarla daha iyi uyumluluk sağlar. CPU için yapılan optimizasyonlarla birleştirildiğinde, YOLO26 önceki nesillere kıyasla %43'e varan CPU artışı sağlar ve bu da IoT uygulamaları için önemli bir avantajdır.
İleri Düzey Eğitim İstikrar
Büyük Dil Modeli (LLM) eğitimindeki yeniliklerden ilham alan YOLO26, SGD Muon'un bir melezi olan MuSGD Optimizer'ı(Moonshot AI'nın Kimi K2'sinden ilham alınarak geliştirilmiştir) içerir. Bu, daha hızlı yakınsama ve daha istikrarlı eğitim çalıştırmaları sağlar ve derin öğrenme modellerinin eğitimiyle sıklıkla ilişkilendirilen "deneme yanılma" sürecini azaltır. Ayrıca, ProgLoss ve STAL (Soft-Task Alignment Learning) özelliklerinin eklenmesi, eski modellerin genellikle zorlandığı küçük nesne algılama alanındaki performansı önemli ölçüde artırır.
YOLO26 hakkında daha fazla bilgi edinin
Ultralytics ile Kullanım Kolaylığı
Ultralytics belirleyici özelliklerinden biri Kullanım Kolaylığıdır. İster YOLOv8, YOLOv9veya en son teknoloji ürünü YOLO26 kullanıyor olun, API tutarlı ve basit kalır.
PP-YOLOE+ için PaddlePaddle kurmanın aksine, bu işlem belirli CUDA eşleştirilmesini ve ayrı kütüphane kurulumlarını gerektirebilir, Ultralytics standart bir pip install ultralytics.
from ultralytics import YOLO
# Load a pre-trained YOLO model (YOLO26n for maximum speed)
model = YOLO("yolo26n.pt")
# Train the model on a custom dataset with a single command
# The system handles data augmentation, logging, and plots automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model.predict("path/to/image.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
Sonuç
Her ikisi de YOLOv7 ve PP-YOLOE+ yetenekli mimarilerdir. YOLOv7 , klasik YOLO ve PyTorch yoğun bir şekilde yatırım yapanlar için yüksek doğruluk sunan güçlü bir seçenek YOLOv7 . PP-YOLOE+, Baidu ekosistemindeki kullanıcılar için güçlü parametre verimliliği sunan mükemmel bir rakiptir.
Ancak, iyi bakımlı bir ekosistem, eşsiz çok yönlülük (algılama, segmentasyon, poz tahmini ve OBB'yi kapsayan) ve en son performans atılımlarını arayan geliştiriciler için Ultralytics en üstün seçimdir. Uçtan uca tasarımı, azaltılmış bellek ayak izi ve göreve özel iyileştirmeleri (Poz ve semantik segmentasyon kayıpları için RLE gibi), onu gerçek dünyadaki AI zorlukları için en geleceğe dönük çözüm haline getirir.
En gelişmiş görsel yapay zeka ile yolculuğunuza başlamak için, kesintisiz eğitim ve dağıtım için Ultralytics keşfedin.
Diğer Modelleri İnceleyin
Diğer modellerin nasıl olduğunu görmek ister misiniz? YOLOv6 YOLOv7 ve RT-DETR YOLOv8 karşılaştırmalarımıza göz atarak projenizin gereksinimlerine en uygun modeli bulun.