PP-YOLOE+ ve DAMO-YOLO: Kapsamlı Bir Teknik Karşılaştırma

Bilgisayarlı görüdeki sürekli gelişim, gerçek zamanlı nesne tespiti için oldukça özelleşmiş bir dizi mimari ortaya çıkardı. Endüstriyel ve araştırma uygulamaları için modelleri değerlendirirken, 2022 yılından iki öne çıkan çerçeve genellikle tartışmalara dahil olur: Baidu'dan PP-YOLOE+ ve Alibaba Group'tan DAMO-YOLO. Her iki model de yeni omurgalar, gelişmiş etiket atama stratejileri ve özelleşmiş özellik birleştirme teknikleri sunarak çapasız (anchor-free) tespitin sınırlarını zorladı.

Bu kılavuz, PP-YOLOE+ ve DAMO-YOLO'nun mimarilerini, eğitim metodolojilerini ve dağıtım güçlerini keşfeden ayrıntılı bir teknik analizini sunar. Ayrıca, belirli dağıtım kısıtlamaların için en doğru aracı seçmene yardımcı olmak adına bu çerçevelerin Ultralytics YOLO26 gibi modern çözümlerle nasıl karşılaştırıldığını da inceleyeceğiz.

PP-YOLOE+: İyileştirilmiş Endüstriyel Nesne Tespiti

Baidu ekosistemi içinde geliştirilen PP-YOLOE+, PaddlePaddle derin öğrenme çerçevesi için yoğun bir şekilde optimize edilmiş, orijinal PP-YOLOE'nin yinelemeli bir iyileştirmesidir. Sunucu sınıfı donanımlarda doğruluğu ve çıkarım hızını en üst düzeye çıkarmak için tasarlanmıştır, bu da onu endüstriyel denetim ve akıllı perakende uygulamaları için güçlü bir aday haline getirir.

Mimari Yenilikler

PP-YOLOE+, önceki çapasız tespit edicileri geliştirmek için çeşitli mimari iyileştirmeler sunar:

  • CSPRepResNet Omurga: Bu omurga, özellik çıkarma yeteneği ile çıkarım gecikmesi arasında güçlü bir denge sunan, Cross Stage Partial (CSP) bağlantılarıyla birleştirilmiş RepVGG tarzı bir mimari kullanır.
  • Görev Hizalama Öğrenimi (TAL): PP-YOLOE+, eğitim sırasında sınıflandırma ve regresyon görevlerini hizalayan, eğitim ve çıkarım performansı arasındaki boşluğu azaltan gelişmiş bir dinamik etiket atama stratejisi kullanır.
  • Verimli Görev Hizalamalı Başlık (ET-head): Uzamsal çözünürlükten ödün vermeden özellikleri hızlı bir şekilde işlemek için tasarlanmış, yüksek mAP metriklerini korumak için oldukça faydalı olan modern bir tespit başlığı.

PP-YOLOE+ Detayları:

PP-YOLOE+ hakkında daha fazla bilgi edin

DAMO-YOLO: Uç Noktada Sinirsel Mimari Arama

Alibaba DAMO Academy tarafından yaratılan DAMO-YOLO, belirgin şekilde farklı bir yaklaşım benimser. Araştırma ekibi, omurgayı manuel olarak tasarlamak yerine, katı gecikme kısıtlamaları için özel olarak uyarlanmış yüksek verimli ağ topolojilerini keşfetmek için Sinirsel Mimari Arama (NAS) kullandı.

Temel Özellikler ve Eğitim Hattı

DAMO-YOLO, otomatikleştirilmiş ve damıtma ağırlıklı bir metodoloji aracılığıyla düşük gecikme ve yüksek doğruluğu vurgular:

  • MAE-NAS Omurgalar: Verimli Sinirsel Mimari Arama Otomasyonu Yöntemini kullanarak DAMO-YOLO, parametreler ve doğruluk arasındaki denge için özel olarak optimize edilmiş omurgalar oluşturur.
  • Verimli RepGFPN: Yeniden parametrelendirilmiş bir Genelleştirilmiş Özellik Piramidi Ağı, modelin tek bir karede çok farklı boyutlardaki nesneleri tespit etmesine yardımcı olan sağlam çok ölçekli özellik birleştirmeyi sağlar.
  • ZeroHead Tasarımı: Çıkarım aşamasında hesaplama yükünü önemli ölçüde azaltan oldukça basitleştirilmiş bir tespit başlığı.
  • Damıtma İyileştirmesi: Daha küçük varyantların performansını artırmak için DAMO-YOLO, daha büyük bir öğretmen modelin öğrenci modele rehberlik ettiği karmaşık bir bilgi damıtma sürecine büyük ölçüde güvenir.

DAMO-YOLO Detayları:

DAMO-YOLO hakkında daha fazla bilgi edinin

Çerçeve Bağımlılığı

PP-YOLOE+ ve DAMO-YOLO sağlam teorik yenilikler sunsa da, kendi çerçevelerine (PaddlePaddle ve belirli Alibaba ortamları) sıkı bir şekilde bağlıdırlar. Bu, bu modelleri standart bulut veya uç nokta dağıtımlarına aktarmaya çalışırken sürtünmeye neden olabilir.

Performans Analizi

Bu modelleri değerlendirirken, gecikme, hesaplama karmaşıklığı (FLOPs) ve ortalama Hassasiyet (mAP) arasındaki denge, ideal dağıtım ortamlarını belirler.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

DAMO-YOLO genellikle nano ve tiny ölçeklerinde daha düşük TensorRT gecikmeleri elde eder, bu da onu yüksek verimli video akışları için oldukça rekabetçi kılar. Ancak, PP-YOLOE+ ekstra büyük (x) varyantına inanılmaz derecede iyi ölçeklenir ve çıkarım süresinin ikincil bir endişe olduğu karmaşık görüntüler için üst düzey doğruluk sağlar.

Ultralytics Avantajı: 2022 Mimarilerinin Ötesine Geçmek

PP-YOLOE+ ve DAMO-YOLO önemli kilometre taşlarını temsil etse de, modern geliştirme daha fazla çok yönlülük, daha kolay eğitim hatları ve daha düşük bellek gereksinimleri talep eder. Ultralytics Platform, eski modellerin gerektirdiği karmaşık damıtma ve çerçeveye özgü kurulumları büyük ölçüde geride bırakan, sıfır sürtünmeli bir deneyim sunarak bu ihtiyaçları karşılar.

Bugün en iyi performans dengesini elde etmek isteyen geliştiriciler için Ultralytics YOLO26, gerçek dünya dağıtım verimliliğinde devrim niteliğinde bir sıçrama sağlar.

YOLO26 Neden Sektöre Liderlik Ediyor

2026'nın başlarında piyasaya sürülen YOLO26, üretim için özel olarak hazırlanmış çığır açan teknolojileri tanıtarak YOLO11 mirasının üzerine inşa edilmiştir:

  • Uçtan Uca NMS'siz Tasarım: YOLO26, NMS (Non-Maximum Suppression) sonrası işlemeyi ortadan kaldırır. Bu, daha basit bir dağıtım mantığı ve tutarlı, oldukça tahmin edilebilir çıkarım gecikmeleri anlamına gelir.
  • MuSGD Optimize Edici: Büyük dil modeli eğitim tekniklerinden esinlenen YOLO26, hibrit bir MuSGD optimize edici kullanır. Bu, inanılmaz derecede kararlı bir eğitim ve hızlı yakınsama sağlayarak değerli GPU saatlerinden tasarruf etmeni sağlar.
  • Üstün CPU Çıkarımı: Dağılım Odak Kaybını (DFL) kaldırarak ve ağ grafiğini optimize ederek, YOLO26 %43'e kadar daha hızlı CPU çıkarımı sağlar, bu da onu uç yapay zeka cihazları için birinci sınıf bir seçim haline getirir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone operasyonları ve uzaktan algılama için kritik olan küçük nesne tanımada dikkate değer iyileştirmeler sağlar.
  • Benzersiz Çok Yönlülük: Sadece tespiti hedefleyen PP-YOLOE+'ın aksine, YOLO26 yerel olarak poz tahmini, örnek bölümleme, görüntü sınıflandırma ve yönlendirilmiş sınırlayıcı kutuları (OBB) sorunsuz bir şekilde destekler.

Kullanım Kolaylığı ve Eğitim Verimliliği

Bir DAMO-YOLO modeli eğitmek, ağır bir öğretmen-öğrenci damıtma hattını yönetmeyi gerektirir. Buna karşılık, bir Ultralytics modelini eğitmek, rakip mimarilere kıyasla minimum CUDA bellek kullanımıyla sadece birkaç satır Python kodu gerektirir.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

YOLO26 hakkında daha fazla bilgi edin

İdeal Kullanım Durumları ve Öneriler

En uygun bilgisayarlı görü mimarisini seçmek, büyük ölçüde ekibinin ekosistem entegrasyonuna ve dağıtım hedeflerine bağlıdır.

  • Tüm hattın Baidu PaddlePaddle ekosistemine derinden gömülü ise PP-YOLOE+ seç. Doğruluğu en üst düzeye çıkarmanın birincil hedef olduğu güçlü sunucularda statik görüntü analizi için mükemmel bir seçenek olmaya devam ediyor.
  • Sinirsel Mimari Arama algoritmaları üzerine özel bir araştırma yapıyorsan veya agresif TensorRT gecikme hedeflerine ulaşmak için karmaşık damıtma hatlarını sürdürecek mühendislik kaynaklarına sahipsen DAMO-YOLO seç.
  • Neredeyse tüm modern üretim senaryoları için Ultralytics YOLO26 seç. Ultralytics ekosistemi, benzersiz belgeler, daha düşük bellek gereksinimleri ve kolaylaştırılmış bir API sağlar. İster otomatik kalite kontrol sistemleri inşa ediyor ol, ister Raspberry Pi üzerinde gerçek zamanlı takip çalıştırıyor ol, YOLO26'nın NMS'siz mimarisi kutudan çıkar çıkmaz hızlı, kararlı ve son derece doğru sonuçlar sağlar.

Diğer en son teknoloji çözümleri keşfeden geliştiriciler için Ultralytics dokümantasyonu, yaygın olarak kullanılan YOLOv8 ve güçlü YOLO11 hakkında geniş kaynaklar sunar ve her türlü bilgisayarlı görü zorluğu için doğru modele sahip olmanı sağlar.

Yorumlar