YOLOv7 ve PP-YOLOE+: Gerçek Zamanlı Dedektörlerin Kapsamlı Bir Karşılaştırması

Üretim süreçleri için en güncel bilgisayarlı görü modellerini değerlendirirken, geliştiriciler genellikle farklı mimarilerin avantajlarını tartar. Nesne algılama dünyasındaki iki dikkat çekici model YOLOv7 ve PP-YOLOE+ modelleridir. Bu rehber, bir sonraki bilgisayarlı görü projen için bilinçli bir karar vermene yardımcı olmak amacıyla mimarileri, performans metrikleri ve ideal dağıtım senaryoları hakkında ayrıntılı teknik bir karşılaştırma sunar.

Mimari Yenilikler

Bu modeller arasındaki temel yapısal farkları anlamak, eğitim ve çıkarım sırasında nasıl davranacaklarını tahmin etmek için çok önemlidir.

YOLOv7 Mimarisinin Öne Çıkanları

YOLOv7, çıkarım maliyetlerini önemli ölçüde artırmadan doğruluğu artırmak için tasarlanmış çeşitli önemli yenilikler getirmiştir.

  • Genişletilmiş Verimli Katman Birleştirme Ağları (E-ELAN): Bu mimari, en kısa ve en uzun gradyan yollarını kontrol eder. Bunu yaparak, ağın daha çeşitli özellikleri öğrenmesini sağlar ve orijinal gradyan yolunu bozmadan genel öğrenme kapasitesini geliştirir.
  • Model Ölçeklendirme Stratejileri: YOLOv7, farklı boyutlar genelinde optimal mimari yapısını korumak için katmanları birleştirirken derinliği ve genişliği eşzamanlı olarak ayarlayan bileşik model ölçeklendirmeyi kullanır.
  • Eğitilebilir Bag-of-Freebies: Yazarlar, modelin tahmin gücünden ödün vermeden çıkarım hızını önemli ölçüde artıran, özdeşlik bağlantıları içermeyen yeniden parametrelendirilmiş bir evrişim yöntemi (RepConv) entegre etmişlerdir.

YOLOv7 Detayları:
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696

YOLOv7 hakkında daha fazla bilgi edinin

PP-YOLOE+ Mimarisinin Öne Çıkanları

Baidu tarafından PaddlePaddle ekosistemi içinde geliştirilen PP-YOLOE+, selefi PP-YOLOv2 üzerine inşa edilmiştir ve büyük ölçüde çapasız (anchor-free) metodolojilere ve geliştirilmiş özellik temsillerine odaklanır.

  • Çapasız Tasarım: Çapa tabanlı yaklaşımların aksine, bu tasarım tahmin kafasını basitleştirir ve hiperparametre sayısını azaltarak modelin özel veri setleri için ayarlanmasını kolaylaştırır.
  • CSPRepResNet Omurga: Bu omurga, hesaplama verimliliğini korurken özellik çıkarma yeteneklerini geliştirmek için artık bağlantıları ve Çapraz Aşamalı Kısmi (Cross Stage Partial) ağları içerir.
  • Görev Hizalama Öğrenimi (TAL): PP-YOLOE+, tek aşamalı dedektörlerdeki yaygın bir darboğazı ele alarak sınıflandırma ve yerelleştirme görevlerini daha iyi hizalamak için ET-head (Verimli Görev hizalı kafa) kullanır.

PP-YOLOE+ Detayları:
Yazarlar: PaddlePaddle Yazarları
Kuruluş: Baidu
Tarih: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250

PP-YOLOE+ hakkında daha fazla bilgi edin

Performans Metrikleri ve Karşılaştırmalar

Doğru modeli seçmek genellikle donanımının ve gecikme gereksinimlerinin özel kısıtlamalarına dayanır. Aşağıdaki tablo, doğruluk (mAP), hız ve model karmaşıklığı arasındaki ödünleşimleri göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Sonuçların Analizi

  • Yüksek Doğruluk Senaryoları: YOLOv7x, karmaşık algılama görevleri için rekabetçi, yüksek bir mAP elde ederek güçlü bir performans sergiler. PP-YOLOE+x mAP değerinde biraz daha yüksek ölçeklense de, bunu parametrelerde ve FLOP'larda önemli bir artışla yapar.
  • Verimlilik ve Hız: PP-YOLOE+'nın daha küçük varyantları (t ve s), son derece düşük TensorRT hızları sunar ve bu da onları donanım kısıtlamalarının katı olduğu uç (edge) dağıtımları için son derece uygun kılar.
  • İdeal Nokta: YOLOv7l, T4 GPU'larda 7 ms'nin altında bir çıkarım süresini korurken %51'in üzerinde mAP sunarak etkileyici bir denge sağlar ve bu da onu standart gerçek zamanlı sunucu uygulamaları için sağlam bir seçenek haline getirir.
Üretim İçin Optimizasyon

Bu modelleri dağıtırken, TensorRT veya ONNX gibi dışa aktarma formatlarından yararlanmak, yerel PyTorch çıkarımına kıyasla gecikmeyi önemli ölçüde azaltabilir.

Ultralytics Avantajı

Hem YOLOv7 hem de PP-YOLOE+ güçlü kıyaslama performansı sunsa da, geliştirme deneyimi ve ekosistem desteği proje başarısı için aynı derecede kritiktir.

Kolaylaştırılmış Kullanıcı Deneyimi

Ultralytics modelleri, birleşik bir Python API aracılığıyla kullanım kolaylığına öncelik verir. PaddlePaddle ekosisteminde ve onun özel yapılandırma dosyalarında gezinmeyi gerektiren PP-YOLOE+'nın aksine Ultralytics, eğitimden dağıtıma sorunsuz bir şekilde geçiş yapmanı sağlar.

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov7.pt")

# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for optimized deployment
model.export(format="engine")  # TensorRT export

Kaynak Verimliliği

Ultralytics YOLO modellerinin en büyük gücü, hem eğitim hem de çıkarım sırasında daha düşük bellek gereksinimlerine sahip olmalarıdır. Bu verimlilik, araştırmacıların ve geliştiricilerin tüketici sınıfı donanımlarda daha büyük yığın boyutları (batch sizes) kullanmalarına olanak tanıyarak eğitimi, daha ağır modellere veya RT-DETR gibi karmaşık Transformer mimarilerine kıyasla hızlandırır.

Ekosistem ve Çok Yönlülük

Ultralytics ekosistemi, sık güncellemeler, kapsamlı dokümantasyon ve standart algılamanın ötesindeki çeşitli görevler için yerel destek içeren, son derece iyi korunmuş bir yapıdır. Ultralytics ile tek bir çerçeve örnek bölümleme, poz tahmini, sınıflandırma ve Yönelimli Sınırlayıcı Kutuları (OBB) destekler ve rakip modellerin genellikle sahip olmadığı benzersiz bir çok yönlülük sağlar.

Vision AI'nın Geleceği: YOLO26

Bilgisayarlı görü hızla geliştikçe, hız ve verimlilik standartlarını yeniden tanımlayan daha yeni mimariler ortaya çıkmıştır. Ocak 2026'da yayınlanan Ultralytics YOLO26, bu evrimin zirvesini temsil eder ve tüm yeni projeler için şiddetle tavsiye edilen tercihtir.

Önemli YOLO26 Yenilikleri:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Maksimum Olmayan Baskılama (NMS) son işlemini ortadan kaldırır. Bu yerel uçtan uca yaklaşım, dağıtım mantığını önemli ölçüde basitleştirir ve ilk kez YOLOv10 ile tanıtılan bir atılım olan değişken gecikmeyi azaltır.
  • Benzersiz Uç Performansı: Dağılımsal Odak Kaybı'nı (DFL) kaldırarak, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder, bu da onu önceki nesillere kıyasla IoT ve uç cihazlar için üstün kılar.
  • Gelişmiş Eğitim Dinamikleri: Moonshot AI'nın Kimi K2'si gibi LLM yeniliklerinden esinlenen MuSGD Optimizer entegrasyonu, daha istikrarlı eğitim ve daha hızlı yakınsama sağlar.
  • Üstün Küçük Nesne Algılama: Geliştirilmiş kayıp fonksiyonları, özellikle ProgLoss + STAL, hava görüntüleri gibi uygulamalar için kritik olan küçük nesneleri tanımadaki tarihsel zayıflıkları giderir.

Gerçek Dünya Uygulamaları

Bu mimariler arasında seçim yapmak genellikle belirli dağıtım ortamına bağlıdır.

PP-YOLOE+ Ne Zaman Seçilmeli

  • PaddlePaddle Entegrasyonu: Altyapın zaten Baidu'nun PaddlePaddle ekosistemiyle derinlemesine entegreyse, PP-YOLOE+ doğal bir uyum sağlar.
  • Asya'da Endüstriyel Denetim: Donanım ve yazılım yığınlarının Baidu araçları için önceden yapılandırıldığı Asya üretim merkezlerinde sıklıkla kullanılır.

Ne Zaman YOLOv7 Seçilmeli

  • GPU Hızlandırmalı Sistemler: Video analitiği gibi yüksek verim gerektiren görevler için sunucu sınıfı GPU'larda son derece iyi performans gösterir.
  • Robotik Entegrasyonu: Bilgisayarlı görünün robotikte entegre edilmesi için idealdir ve dinamik ortamlarda hızlı karar vermeye olanak tanır.
  • Akademik Araştırma: Yaygın olarak desteklenir ve PyTorch tabanlı araştırmalarda güvenilir bir temel (baseline) olarak sıklıkla kullanılır.

Eski modeller tarihsel bir öneme sahip olsa da, YOLO26 veya YOLO11 gibi modern mimarilere Ultralytics Platform aracılığıyla geçiş yapmak, en son optimizasyonlara, en basit eğitim iş akışlarına ve bugün mevcut olan en kapsamlı çoklu görev desteğine erişimini sağlar.

Yorumlar