YOLOv7 PP-YOLOE+: Gerçek Zamanlı Nesne Algılamada Mimari Karşılaştırma

Bilgisayar görüşünün manzarası sürekli yeniliklerle şekilleniyor ve 2022, iki çok etkili mimarinin piyasaya sürüldüğü önemli bir yıl oldu: YOLOv7 ve PP-YOLOE+. YOLOv7 , "bag-of-freebies" optimizasyonuna odaklanarak YOLO mirasını YOLOv7 , PP-YOLOE+ Baidu'nun PaddlePaddle yüksek performanslı, ankrajsız algılama yönündeki çabasını temsil etti.

Araştırmacılar ve mühendisler için, bu modeller arasında seçim yapmak genellikle belirli çerçeve gereksinimlerine (PyTorch . PaddlePaddle) ve dağıtım donanımına bağlıdır. Bu kılavuz, mimarileri, performans ölçütleri ve kullanılabilirlikleri hakkında derinlemesine teknik bir karşılaştırma sunarken, aynı zamanda bu öncüllerin en iyi özelliklerini sorunsuz, uçtan uca NMS bir çerçeve içinde birleştiren YOLO26 gibi modern alternatifleri de tanıtmaktadır.

Performans Metriklerinin Karşılaştırılması

Aşağıdaki tablo, çeşitli model ölçeklerinde YOLOv7 PP-YOLOE+'nın performansını karşılaştırmaktadır. YOLOv7 sağlam algılama yetenekleri YOLOv7 , PP-YOLOE+ parametre sayısı ve çıkarım hızı arasında oldukça rekabetçi bir denge sunmaktadır.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi

2022 ortasında piyasaya sürülen YOLOv7 , mimari verimlilik ve çıkarım maliyetini artırmayan eğitim optimizasyon stratejilerine odaklanarak nesne algılama sınırlarını YOLOv7 .

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Bağlantılar:ArXiv Makalesi | GitHub Deposu

Temel Mimari Özellikler

YOLOv7 , en kısa ve en uzun gradyan yollarını kontrol etmek için tasarlanmış yeni bir mimari olan E-ELAN'ı (Extended Efficient Layer Aggregation Network)YOLOv7 . Bu mimari, ağın daha çeşitli özellikleri öğrenmesini sağlıyor. Ayrıca, modelin yeniden parametrelendirilmesi ve dinamik etiket ataması dahil olmak üzere "eğitilebilir bag-of-freebies"i yoğun bir şekilde kullandı.

Ancak, YOLOv7 çapa tabanlı bir dedektördür. Bu metodoloji kanıtlanmış olsa da, genellikle özel veri kümeleri için çapa kutularının dikkatli bir şekilde ayarlanmasını gerektirir, bu da YOLOv8 veya YOLO26'da bulunan daha yeni çapa içermeyen uygulamalara kıyasla eğitim sürecini karmaşıklaştırabilir.

YOLOv7 hakkında daha fazla bilgi edinin.

PP-YOLOE+: Anchor'suz Meydan Okuyucu

PP-YOLOE+, Baidu tarafından PaddleDetection paketinin bir parçası olarak geliştirilen PP-YOLOE'nin bir evrimidir. Çeşitli donanımlarda çıkarım hızını en üst düzeye çıkarırken, bağlantı noktası tabanlı yöntemlerin sınırlamalarını gidermek için tasarlanmıştır.

Yazarlar: PaddlePaddle Yazarları
Kuruluş:Baidu
Tarih: 2022-04-02
Bağlantılar:ArXiv Makalesi | GitHub Deposu

Temel Mimari Özellikler

PP-YOLOE+ kullanır demirsiz paradigma, hiperparametrelerin sayısını önemli ölçüde azaltır. Çekirdeği, RepResBlock (RepVGG'den esinlenerek) ve bir Görev Uyumlaştırma Öğrenimi (TAL) sınıflandırma ve yerelleştirme görevlerini dinamik olarak uyumlu hale getiren strateji. Bu, özellikle x (ekstra büyük) ölçekte etkileyici bir sonuç elde eder. %54,7 mAP.

Ekosistem Değerlendirmeleri

PP-YOLOE+ mükemmel performans sunarken, PaddlePaddle çerçevesi PyTorch bir şekilde PyTorch alışkın geliştiriciler, bu modelleri mevcut PyTorch MLOps boru hatlarına entegre etmeye çalışırken veya TorchScriptgibi standart dağıtım araçlarını kullanırken zorluklarla karşılaşabilirler.

Karşılaştırma: Mimari ve Kullanılabilirlik

Anchor Tabanlı - Anchorsız Karşılaştırması

En belirgin fark, sınırlayıcı kutulara yaklaşımlarında yatmaktadır. YOLOv7 , nesneleri algılamak için referans şablonu görevi gören önceden tanımlanmış bağlantı kutuları kullanır. Bu, COCO gibi standart veri kümeleri için iyi sonuç verir, ancak DOTA-v2 gibi veri kümelerinde bulunan düzensiz nesne şekilleriyle manuel olarak döndürülmedikçe sorun yaşayabilir.

PP-YOLOE+, çapa içermez ve nesnelerin merkezini ve sınırlara olan mesafelerini doğrudan tahmin eder. Bu, genel olarak eğitim sürecini basitleştirir. YOLO11 gibi modern Ultralytics YOLO11 ve YOLO26 gibi modern Ultralytics modelleri de esnekliği ve hızı en üst düzeye çıkarmak için çapa içermeyen ve hatta NMS mimarileri tamamen benimsemiştir.

Bellek ve Verimlilik

Ultralytics , eğitim verimlilikleriyle ünlüdür. YOLOv7 , E-ELAN'daki karmaşık birleştirme yolları nedeniyle en büyük modelleri için önemli miktarda GPU YOLOv7 , PP-YOLOE+ bunu yeniden parametrelendirme yoluyla optimize eder. Ancak, YOLO26 gibi daha yeni versiyonlar, Dağıtım Odak Kaybı (DFL) gibi ağır bileşenleri kaldırarak her ikisini de geride bırakır ve hem eğitim hem de çıkarım sırasında bellek gereksinimlerini önemli ölçüde azaltır.

Gelecek: Neden YOLO26'ya geçmelisiniz?

YOLOv7 PP-YOLOE+ 2022 yılında en son teknolojiyi temsil ederken, bu alan hızla gelişmiştir. Ultralytics tarafından Ocak Ultralytics piyasaya sürülen YOLO26, önceki modellerin belirli sorunlarını ele alarak bu gelişmelerin doruk noktasını temsil etmektedir.

Uçtan Uca NMS'siz Tasarım

YOLOv7 PP-YOLOE+'da en büyük darboğazlardan biri, yinelenen algılamaları filtrelemek için gerekli olan bir son işlem adımı olan Maksimum Dışı Bastırma (NMS)dır. YOLO26, doğal olarak uçtan uca NMS. Bu, kalabalık NMS neden olduğu gecikme değişkenliğini ortadan kaldırarak, otonom araçlar ve trafik izleme gibi gerçek zamanlı uygulamalar için ideal hale getirir.

Edge Computing için optimize edilmiştir

YOLO26, Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasını içerir. Bu mimari sadeleştirme, aşağıdaki formatlara dışa aktarma sürecini kolaylaştırır CoreML ve TFLitegibi formatlara aktarım sürecini kolaylaştırarak düşük güç tüketen cihazlarla daha iyi uyumluluk sağlar. CPU için yapılan optimizasyonlarla birleştirildiğinde, YOLO26 önceki nesillere kıyasla %43'e varan CPU artışı sağlar ve bu da IoT uygulamaları için önemli bir avantajdır.

İleri Düzey Eğitim İstikrar

Büyük Dil Modeli (LLM) eğitimindeki yeniliklerden ilham alan YOLO26, SGD Muon'un bir melezi olan MuSGD Optimizer'ı(Moonshot AI'nın Kimi K2'sinden ilham alınarak geliştirilmiştir) içerir. Bu, daha hızlı yakınsama ve daha istikrarlı eğitim çalıştırmaları sağlar ve derin öğrenme modellerinin eğitimiyle sıklıkla ilişkilendirilen "deneme yanılma" sürecini azaltır. Ayrıca, ProgLoss ve STAL (Soft-Task Alignment Learning) özelliklerinin eklenmesi, eski modellerin genellikle zorlandığı küçük nesne algılama alanındaki performansı önemli ölçüde artırır.

YOLO26 hakkında daha fazla bilgi edinin

Ultralytics ile Kullanım Kolaylığı

Ultralytics belirleyici özelliklerinden biri Kullanım Kolaylığıdır. İster YOLOv8, YOLOv9veya en son teknoloji ürünü YOLO26 kullanıyor olun, API tutarlı ve basit kalır.

PP-YOLOE+ için PaddlePaddle kurmanın aksine, bu işlem belirli CUDA eşleştirilmesini ve ayrı kütüphane kurulumlarını gerektirebilir, Ultralytics standart bir pip install ultralytics.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO26n for maximum speed)
model = YOLO("yolo26n.pt")

# Train the model on a custom dataset with a single command
# The system handles data augmentation, logging, and plots automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model.predict("path/to/image.jpg")

# Export to ONNX for deployment
model.export(format="onnx")

Sonuç

Her ikisi de YOLOv7 ve PP-YOLOE+ yetenekli mimarilerdir. YOLOv7 , klasik YOLO ve PyTorch yoğun bir şekilde yatırım yapanlar için yüksek doğruluk sunan güçlü bir seçenek YOLOv7 . PP-YOLOE+, Baidu ekosistemindeki kullanıcılar için güçlü parametre verimliliği sunan mükemmel bir rakiptir.

Ancak, iyi bakımlı bir ekosistem, eşsiz çok yönlülük (algılama, segmentasyon, poz tahmini ve OBB'yi kapsayan) ve en son performans atılımlarını arayan geliştiriciler için Ultralytics en üstün seçimdir. Uçtan uca tasarımı, azaltılmış bellek ayak izi ve göreve özel iyileştirmeleri (Poz ve semantik segmentasyon kayıpları için RLE gibi), onu gerçek dünyadaki AI zorlukları için en geleceğe dönük çözüm haline getirir.

En gelişmiş görsel yapay zeka ile yolculuğunuza başlamak için, kesintisiz eğitim ve dağıtım için Ultralytics keşfedin.

Diğer Modelleri İnceleyin

Diğer modellerin nasıl olduğunu görmek ister misiniz? YOLOv6 YOLOv7 ve RT-DETR YOLOv8 karşılaştırmalarımıza göz atarak projenizin gereksinimlerine en uygun modeli bulun.

YOLOv7 PP-YOLOE+: Gerçek Zamanlı Nesne Algılamada Mimari Karşılaştırma

Performans Metriklerinin Karşılaştırılması

YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi

Temel Mimari Özellikler

PP-YOLOE+: Anchor'suz Meydan Okuyucu

Temel Mimari Özellikler

Karşılaştırma: Mimari ve Kullanılabilirlik

Anchor Tabanlı - Anchorsız Karşılaştırması

Bellek ve Verimlilik

Gelecek: Neden YOLO26'ya geçmelisiniz?

Uçtan Uca NMS'siz Tasarım

Edge Computing için optimize edilmiştir

İleri Düzey Eğitim İstikrar

Ultralytics ile Kullanım Kolaylığı

Sonuç

Yorumlar