İçeriğe geç

PP-YOLOE+ ve YOLO26 Karşılaştırması: SOTA Nesne Dedektörlerine Derinlemesine Bir Bakış

Nesne algılama alanı, araştırmacıların doğruluk, hız ve verimlilik sınırlarını zorlamasıyla sürekli gelişmektedir. Bu kapsamlı analiz, Baidu'nun PaddlePaddle ekibinden gelişmiş bir dedektör olan PP-YOLOE+ ile Ultralytics'in en son teknoloji ürünü modeli olan YOLO26 olmak üzere iki önemli modeli karşılaştırmaktadır.

PP-YOLOE+, piyasaya sürüldüğünde anchor-free algılamada önemli yenilikler sunsa da, YOLO26, modern uç uygulamaları için yerel uçtan uca yetenekler, basitleştirilmiş dağıtım ve üstün performans sunarak nesiller arası bir ileri sıçramayı temsil etmektedir.

PP-YOLOE+: Gelişmiş Anchor'suz Detect

PP-YOLOE+, Baidu'daki PaddlePaddle ekibi tarafından geliştirilen PP-YOLOE'nin yükseltilmiş bir versiyonudur. 2022'de piyasaya sürülen bu model, güçlü bir backbone ve verimli bir başlık tasarımı aracılığıyla eğitim yakınsamasını ve sonraki görev performansını iyileştirmeye odaklanmaktadır.

PP-YOLOE+ Detayları:

Mimari ve Metodoloji

PP-YOLOE+, daha zengin özellikler yakalamak için büyük çekirdek tasarımını kullanan CSPRepResNet backbone'u üzerine inşa edilmiştir. Sınıflandırma ve konumlandırma görevleri arasında yüksek kaliteli hizalama sağlayarak etiketleri dinamik olarak atamak için TAL (Görev Hizalama Öğrenimi) stratejisini kullanır.

Temel mimari özellikler şunları içerir:

  • Anchor-Free Tasarım: Önceden tanımlanmış anchor kutularına olan ihtiyacı ortadan kaldırarak hiperparametre ayarlamasını azaltır.
  • Verimli Görev Hizalı Başlık (ET-Head): Hız ve doğruluk arasındaki dengeyi optimize eder.
  • Dinamik Etiket Ataması: Eğitim kararlılığını artırmak için yumuşak bir etiket atama stratejisi kullanır.

Dönemi için yenilikçi olsa da, PP-YOLOE+, işlem sonrası için geleneksel Non-Maximum Suppression (NMS) yöntemine dayanır. Bu adım, çıkarım sırasında gecikme ekler ve NMS uygulamaları TensorRT veya ONNX Runtime gibi farklı donanım platformlarında değişiklik gösterebildiği için dağıtım süreçlerini karmaşıklaştırır.

YOLO26: Uç Yapay Zeka için Yeni Standart

2026'nın başlarında piyasaya sürülen YOLO26, önceki nesillerde yaygın olan dağıtım darboğazlarını çözmek için sıfırdan tasarlanmıştır. Yerel olarak NMS içermeyen uçtan uca bir mimari sunarak, kaynak kısıtlı cihazlarda dağıtımını önemli ölçüde daha hızlı ve kolay hale getirir.

YOLO26 Detayları:

Mimari ve Yenilikler

YOLO26, etiket atama ve kod çözme mantığını doğrudan model yapısına entegre ederek geleneksel çapa tabanlı veya çapasız paradigmaların ötesine geçer.

  • Uçtan Uca NMS İçermeyen: Eğitim sırasında bire bir eşleşmeleri tahmin ederek, YOLO26 NMS ihtiyacını tamamen ortadan kaldırır. İlk olarak YOLOv10'da öncülük edilen bu çığır açan gelişme, öngörülebilir gecikme ve daha basit dışa aktarma mantığı sağlar.
  • DFL Kaldırma: Distribution Focal Loss'un kaldırılması, çıktı başlıklarını basitleştirerek modeli 8-bit niceleme ve uç dağıtımı için daha uygun hale getirir.
  • MuSGD Optimizatörü: LLM eğitimi (Kimi K2) tarafından ilham alınan, SGD ve Muon'un bir hibriti, kararlı yakınsama ve geliştirilmiş genelleme sağlar.
  • ProgLoss + STAL: Yeni kayıp fonksiyonları, önceki dedektörlerde yaygın bir zayıflık olan küçük nesne tespitini özel olarak hedefler.

YOLO26 hakkında daha fazla bilgi edinin

Neden Uçtan Uca Yaklaşım Önemlidir

Geleneksel nesne dedektörleri binlerce aday kutu çıkarır ve yinelenenleri filtrelemek için NMS gerektirir. NMS, hesaplama açısından pahalıdır ve donanım hızlandırıcılarında (TPU'lar veya NPU'lar gibi) optimize edilmesi zordur. YOLO26'nın uçtan uca tasarımı, nihai kutuları doğrudan çıkararak bu darboğazı ortadan kaldırır ve CPU'larda çıkarımı %43'e kadar hızlandırır.

Performans Karşılaştırması

Performansı karşılaştırırken, YOLO26 özellikle CPU tabanlı çıkarım ve basitleştirilmiş dağıtım iş akışları için verimlilikte açık bir avantaj sergiler. PP-YOLOE+ güçlü bir akademik temel olmaya devam etse de, YOLO26 daha az parametre ve önemli ölçüde daha düşük gecikme ile daha yüksek mAPval sunar.

Aşağıdaki tablo, COCO veri kümesi üzerindeki performans metriklerini vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Temel Çıkarımlar

  1. Verimlilik: YOLO26n, PP-YOLOE+t'den (39.9 mAP) daha yüksek doğruluk (40.9 mAP) elde ederken, önemli ölçüde daha az FLOP (5.4B'ye karşı 19.15B) kullanır. Bu, YOLO26'yı mobil ve pille çalışan uygulamalar için belirgin şekilde daha iyi hale getirir.
  2. Ölçeklenebilirlik: En büyük ölçekte, YOLO26x, daha küçük bir parametre sayısını (55.7M'ye karşı 98.42M) korurken PP-YOLOE+x'i yaklaşık 3.0 mAP ile geride bırakır.
  3. Çıkarım Hızı: NMS ve DFL'nin kaldırılması, YOLO26'nın CPU'larda %43'e kadar daha hızlı çalışmasını sağlar; bu, GPU'ların bulunmadığı Raspberry Pi'ler veya genel bulut örnekleri gibi cihazlar için kritik bir metriktir.

Kullanılabilirlik ve Ekosistem

Bir modelin gerçek değeri, ham metriklerin ötesine, üretim ortamına ne kadar kolay entegre edilebildiğine kadar uzanır.

Ultralytics Ekosistem Avantajı

Ultralytics, kullanım kolaylığı ve sorunsuz bir geliştirici deneyimine öncelik verir. Basit bir Python API'si ile kullanıcılar, kurulumdan eğitime dakikalar içinde geçebilirler.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for deployment
path = model.export(format="onnx")

Ultralytics ekosistemi ayrıca şunları içerir:

Eğitim Verimliliği

YOLO26, eğitim sırasında daha düşük bellek tüketimi için tasarlanmıştır. Yeni MuSGD optimizatörü, eğitim dinamiklerini stabilize eder ve genellikle PP-YOLOE+ için gereken programa kıyasla yakınsamaya ulaşmak için daha az epoch gerektirir. Bu, araştırma ve geliştirme için daha düşük bulut bilişim maliyetleri ve daha hızlı yineleme döngüleri sağlar.

İdeal Kullanım Senaryoları

PP-YOLOE+'yi Ne Zaman Seçmeli

  • Eski PaddlePaddle İş Akışları: Mevcut altyapınız Baidu PaddlePaddle çerçevesine ve çıkarım motorlarına derinden bağlıysa, PP-YOLOE+ uyumlu bir seçenek olmaya devam eder.
  • Akademik Araştırma: ResNet backbone ailesi içinde çapasız atama stratejilerini özel olarak araştıran araştırmacılar için.

YOLO26 ne zaman seçilmeli

  • Gerçek Zamanlı Uç Dağıtımı: Gecikmenin her milisaniyesinin önemli olduğu Android, iOS veya gömülü Linux üzerindeki uygulamalar için.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın birleşimi, YOLO26'yı drone görüntü analizi veya üretimdeki kusur tespiti gibi görevler için üstün kılar.
  • Çoklu Görev Gereksinimleri: Projeniz, yeni bir API veya kod tabanı öğrenmeden detect, segment ve poz tahmini arasında geçiş yapmayı gerektiriyorsa.
  • Hızlı Prototipleme: Ultralytics paketinin "her şey dahil" yapısı, startup'ların ve kurumsal ekiplerin veriden dağıtıma daha hızlı geçmesini sağlar.

Sonuç

PP-YOLOE+ 2020'lerin başında güçlü bir anchor-free dedektör olarak hizmet verirken, YOLO26 bilgisayar görüşünün geleceğini temsil etmektedir. NMS darboğazını ortadan kaldırarak, CPU hızı için optimize ederek ve birden fazla görüş görevi için birleşik bir arayüz sağlayarak, YOLO26 günümüzün yapay zeka zorlukları için daha sağlam, verimli ve kullanıcı dostu bir çözüm sunar.

En son teknoloji görüş yeteneklerini minimum sürtünmeyle entegre etmek isteyen geliştiriciler için Ultralytics YOLO26 önerilen seçimdir.

Daha Fazlasını Keşfedin

Diğer mimarilerle ilgileniyor musunuz? Tamamen desteklenmeye devam eden önceki nesil modelimiz YOLO11'i keşfedin veya transformer tabanlı detect çözümleri için RT-DETR'e göz atın.


Yorumlar