İçeriğe geç

PP-YOLOE+ ve YOLOv7: Gerçek Zamanlı Nesne Algılama Mimarilerinde Gezinme

Bilgisayar görüşü işlem hatları oluştururken, doğru nesne algılama modelini seçmek kritik öneme sahiptir. 2022'den iki önemli mimari olan PP-YOLOE+ ve YOLOv7, gerçek zamanlı nesne algılamada güçlü ilerlemeler kaydetti. Bu teknik karşılaştırma, uygulamalarınız için bilinçli kararlar vermenize yardımcı olmak amacıyla mimarilerine, eğitim metodolojilerine ve gerçek dünya performanslarına derinlemesine bir bakış sunmaktadır.

Modellere Genel Bakış

Hem PP-YOLOE+ hem de YOLOv7, doğruluk ve hız sınırlarını zorlamak için tasarlanmıştır, ancak farklı geliştirme ekosistemlerinden ve tasarım felsefelerinden gelmektedirler.

PP-YOLOE+

Baidu'daki PaddlePaddle Yazarları tarafından geliştirilen PP-YOLOE+, orijinal PP-YOLOv2 üzerine inşa edilmiştir. PaddlePaddle ekosistemi için optimize edilmiş, verimli ve yüksek doğruluklu bir nesne algılayıcı sağlamak amacıyla tanıtılmıştır.

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLOv7

Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından geliştirilen YOLOv7, yayınlandığı dönemde gerçek zamanlı nesne algılayıcılar için yeni son teknoloji standartları belirlemek amacıyla "eğitilebilir bedava çantası" (trainable bag-of-freebies) konseptini tanıttı.

YOLOv7 hakkında daha fazla bilgi edinin.

Mimari Yenilikler

PP-YOLOE+ Mimarisi

PP-YOLOE+, ağırlıklı olarak anchor-free paradigmasına dayanır ve özel veri kümeleri için anchor kutularını ayarlama ihtiyacını ortadan kaldırarak dağıtım sürecini basitleştirir. Etkili çok ölçekli özellik füzyonu için güçlü bir RepResNet backbone ve CSPNet tarzı bir PAN (Path Aggregation Network) içerir. Ek olarak, eğitim sırasında sınıflandırma ve lokalizasyon görevlerini dinamik olarak hizalamak için Görev Hizalama Öğrenimi (TAL) konseptini kullanır ve çeşitli bilgisayar görüşü görevlerinde yüksek doğruluk sağlar.

YOLOv7 Mimarisi

YOLOv7, Genişletilmiş Verimli Katman Birleştirme Ağı (E-ELAN) sunarak farklı bir yaklaşım benimsedi. Bu mimari, ağın orijinal gradyan yolunu bozmadan daha çeşitli özellikler öğrenmesine olanak tanıyarak daha iyi yakınsamaya yol açar. YOLOv7 ayrıca, çıkarım sırasında evrişimsel katmanları birleştirerek doğruluktan ödün vermeden yürütmeyi hızlandıran model yeniden parametrelendirmesini (özellikle planlanmış yeniden parametrelendirilmiş evrişimleri) yoğun bir şekilde kullanır. Bu, YOLOv7'yi çoklu nesne takibi ve karmaşık güvenlik alarm sistemleri gibi görevlerde olağanüstü güçlü kılar.

Ekosistem Farklılıkları

PP-YOLOE+, Baidu'nun PaddlePaddle çerçevesiyle sıkı bir şekilde entegre olsa da, YOLOv7, tarihsel olarak daha geniş bir topluluk ve ONNX ve TensorRT gibi dağıtım hatlarıyla daha geniş bir kullanıma hazır uyumluluk sunan PyTorch'ta geliştirilmiştir.

Performans Analizi

Hız, parametreler ve doğruluk (mAP) dengelendiğinde, modeller belirli varyanta ve hedef donanıma bağlı olarak birbirine üstünlük sağlar. Aşağıda, metriklerinin kapsamlı bir karşılaştırması yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

PP-YOLOE+x modeli biraz daha yüksek bir mAP elde etse de, YOLOv7 varyantları çok güçlü bir parametre-doğruluk oranı sunar. YOLOv7 mimarisi, TensorRT optimizasyonunun olağanüstü düşük gecikme süresi sağladığı ham GPU işleme için favori olmaya devam etmektedir.

Ultralytics'in Avantajı

Bu modelleri eğitirken ve dağıtırken, seçtiğiniz çerçeve modelin kendisi kadar önemlidir. Ultralytics'i kullanmak, tüm makine öğrenimi yaşam döngüsünü basitleştiren oldukça birleşik bir Python API sayesinde akıcılaştırılmış bir kullanıcı deneyimi sağlar.

  • İyi Yönetilen Ekosistem: Ultralytics YOLO modelleri, sürekli güncellenen bir ekosistemden, sağlam belgelerden ve aktif bir topluluktan faydalanır.
  • Bellek Gereksinimleri: Ultralytics, veri yükleme ve eğitim rejimlerini yoğun bir şekilde optimize eder. Ultralytics YOLO modellerini eğitmek, genellikle ağır transformatör tabanlı mimarilere kıyasla çok daha az CUDA belleği gerektirir, bu da geliştiricilerin tüketici sınıfı donanımlarda daha büyük toplu iş boyutları kullanmasına olanak tanır.
  • Eğitim Verimliliği: Sağlam veri artırma stratejileri ve yerleşik hiperparametre ayarlamadan yararlanan Ultralytics, modellerin hazır önceden eğitilmiş ağırlıklarla hızlı bir şekilde yakınsamasını sağlar.

Basit API Uygulaması

Ultralytics ile bir YOLOv7 modelini eğitmek, karmaşık eğitim komut dosyalarını tamamen soyutlayarak yalnızca birkaç satır kod gerektirir:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

Yeni Standart: YOLO26 Tanıtılıyor

PP-YOLOE+ ve YOLOv7 nesne tespitinde dönüm noktaları olsa da, yapay zeka alanı hızla gelişmektedir. Herhangi yeni bir bilgisayar görüşü projesi için Ultralytics YOLO26'yı şiddetle tavsiye ediyoruz. Ocak 2026'da piyasaya sürülen YOLO26, kenar öncelikli yapay zeka görüşünde büyük bir ilerlemeyi temsil etmektedir.

YOLO26 Neden Eski Mimarilerden Daha İyi Performans Gösteriyor:

  • Uçtan Uca NMS'siz Tasarım: YOLO26, doğal olarak uçtan ucadır. Maksimum Olmayan Bastırma (NMS) sonrası işlemeyi ortadan kaldırarak, öngörülebilir, deterministik çıkarım gecikmesi garanti eder; bu, ilk olarak YOLOv10'da görülen bir yeniliktir.
  • DFL Kaldırma: Dağıtım Odak Kaybı'nın (Distribution Focal Loss) kaldırılması, dışa aktarma sürecini basitleştirir ve düşük güçlü kenar cihazlar için uyumluluğu önemli ölçüde artırır.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Özel GPU'ların bulunmadığı senaryolar için (örneğin, akıllı şehir IoT sensörleri gibi), YOLO26 doğrudan CPU'larda verimli bir şekilde çalışacak şekilde yoğun bir şekilde optimize edilmiştir.
  • MuSGD Optimize Edici: Gelişmiş LLM eğitim tekniklerinden (Moonshot AI'nin Kimi K2'si gibi) esinlenerek, YOLO26 inanılmaz derecede kararlı eğitim ve hızlı yakınsama için SGD ve Muon'un bir hibritini kullanır.
  • ProgLoss + STAL: Bu geliştirilmiş kayıp fonksiyonları, drone hava görüntüleri ve üretim hatası tespiti gibi kullanım durumları için hayati önem taşıyan küçük nesne tespitinde dikkate değer kazanımlar sağlar.

YOLO26 hakkında daha fazla bilgi edinin

İdeal Kullanım Durumları ve Dağıtım Senaryoları

PP-YOLOE+ Ne Zaman Kullanılır

PP-YOLOE+, Baidu ve PaddlePaddle ekosistemine derinden bağlı olduğunuzda öne çıkar. Dağıtım hedefiniz Paddle modelleri için özel olarak tasarlanmış donanım kullanıyorsa (örneğin, belirli Asya üretim hatlarında), PP-YOLOE+ mükemmel doğruluk ve sorunsuz entegrasyon sağlar. Endüstriyel üretim otomasyonu için oldukça etkilidir.

Ne Zaman YOLOv7 Kullanılmalı

YOLOv7, özellikle TensorRT kullanan NVIDIA donanımında dağıtım yapıldığında, genel yüksek performanslı çıkarım için mükemmel bir seçenek olmaya devam etmektedir. PyTorch ekosistemine entegrasyonu, ağın yapısal bütünlüğünün çok önemli olduğu gerçek zamanlı kalabalık yönetimi veya karmaşık poz tahmini görevleri gibi akademik araştırmalar ve özel ticari boru hatları için onu oldukça çok yönlü kılar.

Dikkate Alınması Gereken Diğer Modeller

Kesin ihtiyaçlarınıza bağlı olarak, geniş, üretime hazır esneklik için bu mimarileri YOLO11 ile karşılaştırmak veya projeniz geleneksel evrişimsel ağlara göre görme transformatörlerinin belirli avantajlarını gerektiriyorsa RT-DETR'yi incelemek isteyebilirsiniz.

Sonuç

Hem PP-YOLOE+ hem de YOLOv7, gerçek zamanlı nesne tespiti dünyasına önemli iyileştirmeler getirdi. PP-YOLOE+, PaddlePaddle etrafında standartlaştırılmış ortamlarda üstünlük sağlarken, YOLOv7 PyTorch ve Ultralytics ekosistemleri aracılığıyla inanılmaz esneklik ve performans sunar.

Ancak, bilgisayar görüşü çözümleri ilerlemeye devam ettikçe, modern araçları kullanmak esastır. Ultralytics Platformu'nu ve YOLO26 gibi yeni nesil mimarileri benimseyerek, geliştiriciler uygulamalarının hız, doğruluk ve kullanım kolaylığı açısından en ileri düzeyde kalmasını sağlayabilirler.


Yorumlar