İçeriğe geç

YOLOv7 ve PP-YOLOE+: Gerçek Zamanlı detect'örlerin Kapsamlı Karşılaştırması

Üretim hatları için son teknoloji bilgisayar görüşü modellerini değerlendirirken, geliştiriciler genellikle farklı mimarilerin avantajlarını tartarlar. Nesne detect'leme alanındaki iki önemli model YOLOv7 ve PP-YOLOE+'dır. Bu kılavuz, bir sonraki bilgisayar görüşü projeniz için bilinçli bir karar vermenize yardımcı olmak amacıyla mimarileri, performans metrikleri ve ideal dağıtım senaryolarının ayrıntılı bir teknik karşılaştırmasını sunar.

Mimari Yenilikler

Bu modeller arasındaki temel yapısal farklılıkları anlamak, eğitim ve çıkarım sırasında nasıl davranacaklarını tahmin etmek için çok önemlidir.

YOLOv7 Mimarisinin Öne Çıkanları

YOLOv7, çıkarım maliyetlerini önemli ölçüde artırmadan doğruluğu artırmak için tasarlanmış birkaç önemli gelişme sunmuştur.

  • Genişletilmiş Verimli Katman Birleştirme Ağları (E-ELAN): Bu mimari, en kısa ve en uzun gradyan yollarını kontrol eder. Bunu yaparak, ağın daha çeşitli özellikler öğrenmesini sağlar ve orijinal gradyan yolunu bozmadan genel öğrenme yeteneğini geliştirir.
  • Model Ölçeklendirme Stratejileri: YOLOv7, farklı boyutlarda optimum mimari yapıyı korumak için katmanları birleştirirken derinliği ve genişliği eş zamanlı olarak ayarlayan bileşik model ölçeklendirme kullanır.
  • Eğitilebilir Ücretsiz Özellikler Paketi: Yazarlar, kimlik bağlantıları olmayan yeniden parametrelendirilmiş bir evrişim yöntemi (RepConv) entegre ettiler; bu, modelin tahmin gücünden ödün vermeden çıkarım hızını önemli ölçüde artırır.

YOLOv7 Detayları:
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696

YOLOv7 hakkında daha fazla bilgi edinin.

PP-YOLOE+ Mimarisinin Öne Çıkanları

Baidu tarafından PaddlePaddle ekosistemi içinde geliştirilen PP-YOLOE+, selefi PP-YOLOv2 üzerine inşa edilmiştir ve ağırlıklı olarak anchor-free metodolojilere ve geliştirilmiş özellik temsillerine odaklanmaktadır.

  • Anchor-Free Tasarım: Anchor tabanlı yaklaşımların aksine, bu tasarım tahmin başlığını basitleştirir ve hiperparametre sayısını azaltarak modelin özel veri kümeleri için ayarlanmasını kolaylaştırır.
  • CSPRepResNet backbone: Bu backbone, hesaplama verimliliğini korurken özellik çıkarma yeteneklerini geliştirmek için artık bağlantıları ve Çapraz Aşama Kısmi ağları içerir.
  • Görev Hizalama Öğrenimi (TAL): PP-YOLOE+, sınıflandırma ve konumlandırma görevlerini daha iyi hizalamak için ET-head (Verimli Görev Hizalı başlık) kullanır ve tek aşamalı detect'örlerde yaygın bir darboğazı giderir.

PP-YOLOE+ Detayları:
Yazarlar: PaddlePaddle Yazarları
Kuruluş: Baidu
Tarih: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250

PP-YOLOE+ hakkında daha fazla bilgi edinin

Performans Metrikleri ve Kıyaslamalar

Doğru modeli seçmek genellikle donanımınızın belirli kısıtlamalarına ve gecikme gereksinimlerine bağlıdır. Aşağıdaki tablo, doğruluk (mAP), hız ve model karmaşıklığı arasındaki dengeyi göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Sonuçların Analizi

  • Yüksek Doğruluk Senaryoları: YOLOv7x, karmaşık detect'leme görevleri için rekabetçi yüksek bir mAP elde ederek güçlü performans sergiler. PP-YOLOE+x, mAP'de biraz daha yüksek ölçeklenirken, bunu parametrelerde ve FLOP'larda önemli bir artışla yapar.
  • Verimlilik ve Hız: PP-YOLOE+'nın daha küçük varyantları (t ve s), son derece düşük TensorRT hızları sunarak, donanım kısıtlamalarının katı olduğu uç dağıtımlar için oldukça uygun hale getirir.
  • İdeal Nokta: YOLOv7l, T4 GPU'larda 7ms'nin altında bir çıkarım süresi sağlarken %51'in üzerinde mAP sunarak cazip bir denge sağlar ve standart gerçek zamanlı sunucu uygulamaları için sağlam bir seçimdir.

Üretim İçin Optimizasyon

Bu modelleri dağıtırken, TensorRT veya ONNX gibi dışa aktarma formatlarından yararlanmak, yerel PyTorch çıkarımına kıyasla gecikmeyi önemli ölçüde azaltabilir.

Ultralytics'in Avantajı

Hem YOLOv7 hem de PP-YOLOE+ güçlü kıyaslama performansı sunsa da, geliştirme deneyimi ve ekosistem desteği proje başarısı için eşit derecede kritiktir.

Kolaylaştırılmış Kullanıcı Deneyimi

Ultralytics modelleri, birleşik bir Python API aracılığıyla kullanım kolaylığını önceliklendirir. PaddlePaddle ekosisteminde ve özel yapılandırma dosyalarında gezinmeyi gerektiren PP-YOLOE+'nın aksine, Ultralytics eğitimden dağıtıma sorunsuz bir geçiş yapmanızı sağlar.

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov7.pt")

# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for optimized deployment
model.export(format="engine")  # TensorRT export

Kaynak Verimliliği

Ultralytics YOLO modellerinin önemli bir gücü, hem eğitim hem de çıkarım sırasında daha düşük bellek gereksinimleridir. Bu verimlilik, araştırmacıların ve geliştiricilerin tüketici sınıfı donanımlarda daha büyük yığın boyutları kullanmasına olanak tanıyarak, daha ağır modellere veya RT-DETR gibi karmaşık Transformer mimarilerine kıyasla eğitim sürecini hızlandırır.

Ekosistem ve Çok Yönlülük

Ultralytics ekosistemi, sık güncellemeler, kapsamlı dokümantasyon ve standart detect'in ötesinde çeşitli görevler için yerel destek sunarak olağanüstü iyi yönetilmektedir. Ultralytics ile tek bir framework; örnek segmentasyon, poz tahmini, sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutular (obb) gibi görevleri destekleyerek, rakip modellerin genellikle sahip olmadığı eşsiz bir çok yönlülük sağlar.

Görsel Yapay Zekanın Geleceği: YOLO26

Bilgisayar görüşü hızla geliştikçe, hız ve verimlilik standartlarını yeniden tanımlayan yeni mimariler ortaya çıkmıştır. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, bu evrimin zirvesini temsil etmekte ve tüm yeni projeler için şiddetle tavsiye edilen bir seçimdir.

Temel YOLO26 Yenilikleri:

  • Uçtan Uca NMS'siz Tasarım: YOLO26, Non-Maximum Suppression (NMS) son işlemeyi ortadan kaldırır. Bu yerel uçtan uca yaklaşım, dağıtım mantığını önemli ölçüde basitleştirir ve değişken gecikmeyi azaltır; bu, YOLOv10'da ilk kez tanıtılan bir yeniliktir.
  • Benzersiz Uç Cihaz Performansı: Distribution Focal Loss (DFL) kaldırarak, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder, bu da onu IoT ve uç cihazlar için önceki nesillere göre üstün kılar.
  • Gelişmiş Eğitim Dinamikleri: Moonshot AI'ın Kimi K2'si gibi LLM yeniliklerinden esinlenilen MuSGD Optimizer'ın entegrasyonu, daha istikrarlı eğitim ve daha hızlı yakınsama sağlar.
  • Üstün Küçük Nesne detect'i: Gelişmiş kayıp fonksiyonları, özellikle ProgLoss + STAL, küçük nesneleri tanımadaki geçmiş zayıflıkları giderir ve hava görüntüleri gibi uygulamalar için kritik öneme sahiptir.

Gerçek Dünya Uygulamaları

Bu mimariler arasında seçim yapmak genellikle belirli dağıtım ortamına bağlıdır.

Ne Zaman PP-YOLOE+ Seçmeli

  • PaddlePaddle Entegrasyonu: Altyapınız Baidu'nun PaddlePaddle ekosistemiyle zaten derinlemesine entegre ise, PP-YOLOE+ yerel bir uyum sağlar.
  • Asya'da Endüstriyel Denetim: Genellikle donanım ve yazılım yığınlarının Baidu'nun araçları için önceden yapılandırıldığı Asya üretim merkezlerinde kullanılır.

YOLOv7 Ne Zaman Tercih Edilmeli?

  • GPU Hızlandırmalı Sistemler: Video analizi gibi yüksek verim gerektiren görevler için sunucu sınıfı GPU'larda olağanüstü performans gösterir.
  • Robotik Entegrasyonu: Robotikte bilgisayar görüşünü entegre etmek için idealdir, dinamik ortamlarda hızlı karar vermeyi sağlar.
  • Akademik Araştırma: PyTorch tabanlı araştırmalarda yaygın olarak desteklenir ve güvenilir bir temel olarak sıkça kullanılır.

Eski modeller tarihsel öneme sahip olsa da, Ultralytics Platformu aracılığıyla YOLO26 veya YOLO11 gibi modern mimarilere geçiş yapmak, en son optimizasyonlara, en basit eğitim iş akışlarına ve günümüzde mevcut olan en geniş çok görevli desteğe erişimi garanti eder.


Yorumlar