İçeriğe geç

DAMO-YOLO ve PP-YOLOE+: Ayrıntılı Teknik Karşılaştırma

Gerçek zamanlı bilgisayar görüşünün oldukça rekabetçi ortamında, belirli dağıtım ihtiyaçlarınız için en uygun mimariyi seçmek çok önemlidir. Bu kılavuz, DAMO-YOLO ve PP-YOLOE+ arasında kapsamlı bir teknik karşılaştırma sunar, mimari tasarımlarına, eğitim metodolojilerine ve performans metriklerine derinlemesine inerek. Ayrıca, bu modellerin yeni piyasaya sürülen Ultralytics YOLO26 gibi en son teknoloji çözümlerine karşı nasıl bir performans sergilediğini de inceleyeceğiz.

Model Genel Bakışları

Her iki çerçeve de 2022'de endüstriyel uygulamalar için güçlü alternatifler olarak ortaya çıktı, doğruluk ve çıkarım hızı sınırlarını zorlamak için gelişmiş tekniklerden yararlanarak.

DAMO-YOLO

Alibaba Group tarafından geliştirilen DAMO-YOLO, gecikme-doğruluk dengesini optimize etmek için çeşitli yeni teknikler tanıttı, otomatik arama tekniklerine ve gelişmiş özellik füzyonuna büyük ölçüde dayanarak.

DAMO-YOLO, donanım verimliliği için optimize edilmiş backbone'ları otomatik olarak tasarlamak amacıyla Çok Ölçekli Mimari Arama (MAE-NAS) kullanır. Ayrıca, boyun özellik birleşimi için verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) ve hafif bir "ZeroHead" tasarımına sahiptir. Dahası, öğrenci modelinin temsil gücünü artırmak için eğitim sırasında damıtma tekniklerine yoğun bir şekilde güvenir.

DAMO-YOLO hakkında daha fazla bilgi edinin

PP-YOLOE+

Baidu PaddlePaddle ekibinden PP-YOLOE+, PP-YOLOE mimarisine yapılan artımlı bir yükseltmedir. Özellikle kendi yerel derin öğrenme çerçevesinde yüksek mAP sunmak için büyük ölçekli ön eğitime ve rafine edilmiş kayıp fonksiyonlarına odaklanır.

PP-YOLOE+, bir CSPRepResNet backbone'u ve bir ET-head (Verimli Görev Hizalı Başlık) kullanır. "Plus" sürümü, Objects365 veri kümesi üzerinde güçlü bir ön eğitim stratejisi sunarak, çeşitli gerçek dünya ortamlarında genelleme yeteneğini önemli ölçüde artırır.

PP-YOLOE+ hakkında daha fazla bilgi edinin

Mimari Karşılaştırma

Bu iki model arasındaki tasarım felsefesi farklılığı, ideal kullanım durumlarını ve donanım uyumluluklarını büyük ölçüde etkiler.

Özellik Füzyonu ve backbone'lar

DAMO-YOLO'nun MAE-NAS tarafından üretilen backbone'ları, kenar cihazlara yüksek düzeyde uyarlanmıştır ve genellikle uygun bir hız-parametre oranı sunar. Ancak, bu özel mimariler, örnek segmentasyon gibi yeni görevlere uyarlamak için katı ve karmaşık olabilir. RepGFPN boynu, çok ölçekli özellik birleşimini iyileştirir ancak yeniden parametrelendirme dışa aktarma aşamasında karmaşıklık ekler.

PP-YOLOE+, daha geleneksel ancak oldukça etkili olan CSPRepResNet'e güvenir. Bu backbone, benzer doğruluk için DAMO-YOLO'dan daha büyük bir parametre ayak izi gerektirse de, eğitilmesi oldukça kararlıdır ve mevcut işlem hatlarına entegre edilmesi daha kolaydır. ET-head'i sınıflandırma ve regresyonu verimli bir şekilde ele alır, ancak yine de Non-Maximum Suppression (NMS) gibi ön işleme sonrası adımlar gerektirir.

İşlem Sonrası Gecikmelerini Ortadan Kaldırma

Hem DAMO-YOLO hem de PP-YOLOE+, sınırlayıcı kutuların işlem sonrası için NMS gerektirir. Çıkarım gecikmesi kritikse, yerel olarak Uçtan Uca NMS-Serbest Tasarım özelliğine sahip Ultralytics YOLO26'yı kullanmayı düşünebilirsiniz. Bu çığır açan yaklaşım, daha hızlı ve daha basit bir dağıtım hattı için NMS işlem sonrası adımlarını ortadan kaldırır.

Performans ve Metrik Analizi

Bu modelleri üretim için değerlendirirken, doğruluk (mAP), çıkarım hızı ve parametre boyutu arasındaki denge kritiktir. Aşağıda, birincil varyantlarının doğrudan karşılaştırması yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Tablonun gösterdiği gibi, DAMO-YOLO, NAS-optimize edilmiş backbone'ları sayesinde küçük (s) ve minik (t) ölçeklerde genellikle daha düşük gecikme süresi elde eder. Ancak, PP-YOLOE+, orta (m) ve büyük (l) katmanlara inanılmaz derecede iyi ölçeklenir ve T4 TensorRT hızında hafif bir maliyetle de olsa önemli ölçüde daha yüksek mAP puanları sunar.

Bellek Gereksinimleri ve Eğitim Verimliliği

DAMO-YOLO'nun damıtmaya bağımlılığı, genellikle daha küçük öğrenci modelini eğitmeden önce çok daha büyük bir öğretmen modeli eğitmeniz gerektiği anlamına gelir. Bu durum, CUDA bellek gereksinimlerini ve genel hesaplama bütçesini önemli ölçüde artırır. PP-YOLOE+ bunu standart tek aşamalı eğitimle basitleştirir, ancak PyTorch'a alışkın ekipler için esnekliği sınırlayabilecek PaddlePaddle çerçevesine sıkıca bağlı kalır.

Buna karşılık, modern Ultralytics YOLO26 modeli bu darboğazları çözer. LLM eğitim yeniliklerinden esinlenilen SGD ve Muon'un bir hibriti olan yeni MuSGD Optimizatörü'nü kullanarak, YOLO26 karmaşık damıtma işlem hatları gerektirmeden daha hızlı yakınsama ve oldukça kararlı eğitim sağlar. Ek olarak, YOLO modelleri, RT-DETR gibi transformatör tabanlı dedektörlere kıyasla eğitim sırasında genellikle çok daha az CUDA belleği gerektirir.

Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları

DAMO-YOLO Ne Zaman Kullanılmalı

DAMO-YOLO, gecikmenin nihai darboğaz olduğu yüksek verimli kenar çıkarımı için idealdir. Mühendislik ekibinizin karmaşık damıtma ve yeniden parametrelendirme süreçlerini yönetmek için yeterli kapasiteye sahip olması koşuluyla, küçük varyantları trafik yönetim sistemleri veya temel drone gözetimi gibi ortamlarda üstün performans gösterir.

PP-YOLOE+ Ne Zaman Kullanılır

PP-YOLOE+, Baidu ekosistemine zaten derinden yatırım yapmışsanız veya büyük ölçekli sunucu dağıtımları çalıştırıyorsanız öne çıkar. Etkileyici mAP'si, karmaşık tıbbi görüntü analizi veya yoğun üretim hatası tespiti için uygun hale getirir.

Ultralytics'in Avantajı

Hem DAMO-YOLO hem de PP-YOLOE+ belirli yerel avantajlar sunsa da, maksimum çok yönlülük, hız ve kullanım kolaylığı arayan geliştiriciler sürekli olarak Ultralytics Platformu'na yönelir.

Bilgisayar görüşü işlem hattınızı yükseltirken, Ultralytics YOLO26 eşsiz bir geliştirici deneyimi sunar:

  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL)'nin tamamen kaldırılmasıyla, YOLO26 kenar CPU'larda ve düşük güçlü IoT cihazlarında oldukça hızlıdır.
  • Geliştirilmiş Küçük Nesne Algılama: ProgLoss ve STAL kayıp fonksiyonlarının entegrasyonu, hava görüntüleri için hayati önem taşıyan küçük nesne tanımada önemli iyileşmeler sağlar.
  • Kapsamlı Çok Yönlülük: Yalnızca detect'e odaklanan PP-YOLOE+'dan farklı olarak, YOLO26 poz tahmini, yönlendirilmiş sınırlayıcı kutular (OBB) ve anlamsal segmentasyonu göreve özel mimari iyileştirmelerle sorunsuz bir şekilde ele alır.

Sonuç

DAMO-YOLO ve PP-YOLOE+, çapa içermeyen nesne algılamanın evriminde önemli kilometre taşlarını temsil eder. DAMO-YOLO, kenar gecikmesi için sinir mimarisi aramasının sınırlarını zorlarken, PP-YOLOE+ büyük ölçekli ön eğitimin gücünü gösterdi.

Ancak, hız, doğruluk ve dağıtım basitliğinin en iyi dengesini arayan geliştiriciler için Ultralytics YOLO26 modeli kesin tercihtir. NMS içermeyen mimarisi, sağlam Python API'si ve Weights & Biases ile TensorRT gibi araçlarla sorunsuz entegrasyonu, projelerinizin prototipten üretime sorunsuz bir şekilde geçmesini sağlar.

Başlamaya hazır mısınız? Ultralytics Hızlı Başlangıç Kılavuzu'nu keşfedin veya YOLO11 vs DAMO-YOLO genel bakışımızda daha fazla modeli karşılaştırın.


Yorumlar