İçeriğe geç

PP-YOLOE+ ve DAMO-YOLO: Kapsamlı Bir Teknik Karşılaştırma

Bilgisayar görüşünün sürekli evrimi, gerçek zamanlı nesne tespiti için bir dizi yüksek düzeyde özelleşmiş mimari üretmiştir. Endüstriyel ve araştırma uygulamaları için modeller değerlendirilirken, 2022'den iki önde gelen çerçeve sıklıkla tartışmaya dahil olur: Baidu'dan PP-YOLOE+ ve Alibaba Group'tan DAMO-YOLO. Her iki model de yeni backbone'lar, gelişmiş etiket atama stratejileri ve özel özellik birleştirme teknikleri sunarak anchor-free tespiti sınırlarını zorladı.

Bu kılavuz, PP-YOLOE+ ve DAMO-YOLO'nun mimarilerini, eğitim metodolojilerini ve dağıtım güçlü yönlerini inceleyerek ayrıntılı bir teknik analiz sunmaktadır. Ayrıca, belirli dağıtım kısıtlamalarınız için doğru aracı seçmenize yardımcı olmak amacıyla bu çerçevelerin Ultralytics YOLO26 gibi modern çözümlerle nasıl karşılaştırıldığını da inceleyeceğiz.

PP-YOLOE+: Gelişmiş Endüstriyel Nesne Algılama

Baidu ekosistemi içinde geliştirilen PP-YOLOE+, orijinal PP-YOLOE'nin yinelemeli bir iyileştirmesidir ve PaddlePaddle derin öğrenme çerçevesi için yoğun bir şekilde optimize edilmiştir. Doğruluğu ve çıkarım hızını sunucu sınıfı donanımlarda maksimize etmek üzere tasarlanmıştır, bu da onu endüstriyel denetim ve akıllı perakende uygulamaları için güçlü bir aday yapmaktadır.

Mimari Yenilikler

PP-YOLOE+, önceki anchor-free tespit edicileri geliştirmek için çeşitli mimari iyileştirmeler sunar:

  • CSPRepResNet Backbone: Bu backbone, RepVGG tarzı bir mimariyi Çapraz Aşama Kısmi (CSP) bağlantılarıyla birleştirerek, özellik çıkarma yeteneği ile çıkarım gecikmesi arasında güçlü bir denge sunar.
  • Görev Hizalama Öğrenimi (TAL): PP-YOLOE+, eğitim sırasında sınıflandırma ve regresyon görevlerini hizalayan gelişmiş bir dinamik etiket atama stratejisi kullanır, böylece eğitim ve çıkarım performansı arasındaki farkı azaltır.
  • Verimli Görev Hizalı Başlık (ET-head): Özellikleri uzamsal çözünürlükten ödün vermeden hızla işlemek üzere tasarlanmış, yüksek mAP metriklerini korumak için son derece faydalı, kolaylaştırılmış bir tespit başlığı.

PP-YOLOE+ Detayları:

PP-YOLOE+ hakkında daha fazla bilgi edinin

DAMO-YOLO: Kenarda Sinirsel Mimari Arama

Alibaba DAMO Academy tarafından oluşturulan DAMO-YOLO, belirgin şekilde farklı bir yaklaşım benimser. Backbone'u manuel olarak tasarlamak yerine, araştırma ekibi katı gecikme kısıtlamalarına göre uyarlanmış yüksek verimli ağ topolojilerini keşfetmek için Sinirsel Mimari Arama (NAS) kullandı.

Temel Özellikler ve Eğitim Hattı

DAMO-YOLO, otomatik ve yoğun damıtma metodolojisi aracılığıyla düşük gecikme ve yüksek doğruluğu vurgular:

  • MAE-NAS Backbone'ları: Verimli Sinirsel Mimari Aramayı Otomatikleştirme Yöntemi'ni kullanarak, DAMO-YOLO, özellikle parametreler ve doğruluk arasındaki denge için optimize edilmiş backbone'lar oluşturur.
  • Verimli RepGFPN: Yeniden parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı, modelin tek bir karede çok farklı boyutlardaki nesneleri tespit etmesine yardımcı olan sağlam çok ölçekli özellik birleştirmeyi sağlar.
  • ZeroHead Tasarımı: Çıkarım aşamasında hesaplama yükünü önemli ölçüde azaltan, son derece basitleştirilmiş bir tespit başlığı.
  • Damıtma İyileştirmesi: Daha küçük varyantların performansını artırmak için DAMO-YOLO, daha büyük bir öğretmen modelinin öğrenci modeline rehberlik ettiği karmaşık bir bilgi damıtma sürecine büyük ölçüde güvenir.

DAMO-YOLO Detayları:

DAMO-YOLO hakkında daha fazla bilgi edinin

Çerçeveye Bağımlılık

Hem PP-YOLOE+ hem de DAMO-YOLO sağlam teorik yenilikler sunsa da, kendi çerçevelerine (PaddlePaddle ve belirli Alibaba ortamları) sıkıca bağlıdırlar. Bu durum, bu modelleri standartlaştırılmış bulut veya uç dağıtımlarına taşımaya çalışırken sürtünmeye neden olabilir.

Performans Analizi

Bu modelleri değerlendirirken, gecikme, hesaplama karmaşıklığı (FLOPs) ve ortalama Hassasiyet (mAP) arasındaki denge, ideal dağıtım ortamlarını belirler.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

DAMO-YOLO genellikle nano ve küçük ölçeklerde daha düşük TensorRT gecikmeleri elde eder, bu da onu yüksek verimli video akışları için oldukça rekabetçi kılar. Ancak, PP-YOLOE+ ekstra büyük (x) varyantına inanılmaz derecede iyi ölçeklenir ve çıkarım süresinin ikincil bir endişe olduğu karmaşık görüntüler için en üst düzeyde doğruluk elde eder.

Ultralytics Avantajı: 2022 Mimarilerinin Ötesine Geçmek

PP-YOLOE+ ve DAMO-YOLO önemli kilometre taşlarını temsil etse de, modern geliştirme daha fazla çok yönlülük, daha kolay eğitim hatları ve daha düşük bellek gereksinimleri talep etmektedir. Ultralytics Platformu, eski modellerin gerektirdiği karmaşık damıtma ve çerçeveye özgü kurulumları önemli ölçüde geride bırakan sıfır sürtünmeli bir deneyim sunarak bu ihtiyaçları karşılar.

Bugün en iyi performans dengesini elde etmek isteyen geliştiriciler için Ultralytics YOLO26, gerçek dünya dağıtım verimliliğinde devrim niteliğinde bir adım ileriye taşır.

YOLO26 Neden Sektöre Öncülük Ediyor

2026 başlarında piyasaya sürülen YOLO26, üretime özel çığır açan teknolojiler sunarak YOLO11'in mirası üzerine inşa edilmiştir:

  • Uçtan Uca NMS-Serbest Tasarım: YOLO26, Non-Maximum Suppression (NMS) son işlemeyi ortadan kaldırır. Bu, daha basit dağıtım mantığı ve tutarlı, yüksek oranda tahmin edilebilir çıkarım gecikmeleri anlamına gelir.
  • MuSGD Optimizatörü: Büyük dil modeli eğitim tekniklerinden ilham alan YOLO26, hibrit bir MuSGD optimizatörü kullanır. Bu, inanılmaz derecede kararlı eğitim ve hızlı yakınsama sağlayarak değerli GPU saatlerinden tasarruf sağlar.
  • Üstün CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırarak ve ağ grafiğini optimize ederek YOLO26, %43'e kadar daha hızlı CPU çıkarımı elde eder ve bu da onu uç yapay zeka cihazları için en iyi seçenek haline getirir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada dikkate değer iyileşmeler sağlar; bu da drone operasyonları ve uzaktan algılama için kritik öneme sahiptir.
  • Eşsiz Çok Yönlülük: Yalnızca detect odaklanan PP-YOLOE+'nın aksine, YOLO26; poz tahmini, örnek segmentasyon, görüntü sınıflandırma ve yönlendirilmiş sınırlayıcı kutular (obb)'ı sorunsuz bir şekilde doğal olarak destekler.

Kullanım Kolaylığı ve Eğitim Verimliliği

Bir DAMO-YOLO modeli eğitmek, ağır bir öğretmen-öğrenci damıtma hattını yönetmeyi gerektirir. Buna karşılık, bir Ultralytics modeli eğitmek, rakip mimarilere kıyasla minimum CUDA bellek kullanımıyla yalnızca birkaç satır python kodu gerektirir.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

YOLO26 hakkında daha fazla bilgi edinin

İdeal Kullanım Durumları ve Öneriler

En uygun bilgisayar görüşü mimarisini seçmek, ekibinizin ekosistem entegrasyonuna ve dağıtım hedeflerine büyük ölçüde bağlıdır.

  • PP-YOLOE+'yı seçin eğer tüm hattınız Baidu PaddlePaddle ekosistemine derinlemesine entegre edilmişse. Doğruluğu en üst düzeye çıkarmanın birincil hedef olduğu güçlü sunucularda statik görüntü analizi için mükemmel bir seçim olmaya devam etmektedir.
  • DAMO-YOLO'yu seçin eğer Sinirsel Mimari Arama algoritmaları üzerine özel araştırmalar yapıyorsanız veya agresif TensorRT gecikme hedeflerine ulaşmak için karmaşık damıtma hatlarını sürdürmek için mühendislik kaynaklarına sahipseniz.
  • Ultralytics YOLO26'yı seçin neredeyse tüm modern üretim senaryoları için. Ultralytics ekosistemi, eşsiz dokümantasyon, daha düşük bellek gereksinimleri ve kolaylaştırılmış bir API sunar. İster otomatik kalite kontrol sistemleri kuruyor olun, ister bir Raspberry Pi üzerinde gerçek zamanlı track yapıyor olun, YOLO26'nın NMS-serbest mimarisi, kutudan çıktığı gibi hızlı, kararlı ve yüksek doğrulukta sonuçlar sağlar.

Diğer son teknoloji çözümleri araştıran geliştiriciler için, Ultralytics dokümantasyonu ayrıca yaygın olarak benimsenen YOLOv8 ve sağlam YOLO11 hakkında kapsamlı kaynaklar sunarak, herhangi bir bilgisayar görüşü zorluğu için doğru modele sahip olmanızı sağlar.


Yorumlar