DAMO-YOLO ve PP-YOLOE+: Detaylı Bir Teknik Karşılaştırma
Gerçek zamanlı bilgisayarlı görü alanındaki yüksek rekabet ortamında, özel dağıtım ihtiyaçların için en uygun mimariyi seçmek çok önemlidir. Bu rehber, DAMO-YOLO ve PP-YOLOE+ arasında kapsamlı bir teknik karşılaştırma sunarak mimari tasarımlarına, eğitim metodolojilerine ve performans metriklerine derinlemesine bir bakış atar. Ayrıca, bu modellerin yeni piyasaya sürülen Ultralytics YOLO26 gibi en son teknoloji çözümlerle nasıl bir performans sergilediğini de inceleyeceğiz.
Model Genel Bakışları
Her iki çerçeve de 2022 yılında endüstriyel uygulamalar için güçlü alternatifler olarak ortaya çıktı ve doğruluk ile çıkarım hızı sınırlarını zorlamak için gelişmiş tekniklerden yararlandı.
DAMO-YOLO
Alibaba Group tarafından geliştirilen DAMO-YOLO, gecikme-doğruluk dengesini optimize etmek için otomatik arama tekniklerine ve gelişmiş özellik birleştirmeye büyük ölçüde dayanan çeşitli yeni teknikler tanıttı.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: DAMO-YOLO: A Report on Real-Time Object Detection Design
- GitHub: tinyvision/DAMO-YOLO
- Dokümantasyon: DAMO-YOLO README
DAMO-YOLO, donanım verimliliği için optimize edilmiş ana gövdeleri otomatik olarak tasarlamak amacıyla Çok Ölçekli Mimari Arama (MAE-NAS) kullanır. Ayrıca, boyun özellik birleştirme için verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) ve hafif bir "ZeroHead" tasarımına sahiptir. Dahası, öğrenci modelinin temsil gücünü artırmak için eğitim sırasında yoğun bir şekilde damıtma tekniklerine güvenir.
DAMO-YOLO hakkında daha fazla bilgi edinin
PP-YOLOE+
Baidu PaddlePaddle ekibinden gelen PP-YOLOE+, PP-YOLOE mimarisinin artımlı bir yükseltmesidir. Özellikle kendi derin öğrenme çerçevesi içinde yüksek mAP sunmak için büyük ölçekli ön eğitime ve iyileştirilmiş kayıp fonksiyonlarına odaklanır.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş: Baidu
- Tarih: 02.04.2022
- Arxiv: PP-YOLOE: An evolved version of YOLO
- GitHub: PaddlePaddle/PaddleDetection
- Dokümantasyon: PP-YOLOE+ Configs
PP-YOLOE+, bir CSPRepResNet ana gövdesi ve bir ET-head (Verimli Görev uyumlu başlık) kullanır. "Artı" sürümü, çeşitli gerçek dünya ortamlarında genelleme yeteneğini önemli ölçüde artıran Objects365 veri kümesi üzerinde güçlü bir ön eğitim stratejisi sunar.
PP-YOLOE+ hakkında daha fazla bilgi edin
Mimari Karşılaştırma
Bu iki model arasındaki tasarım felsefesi farklılığı, ideal kullanım durumlarını ve donanım uyumluluklarını büyük ölçüde etkiler.
Özellik Birleştirme ve Ana Gövdeler
DAMO-YOLO'nun MAE-NAS ile oluşturulan ana gövdeleri uç cihazlar için oldukça özelleştirilmiştir ve genellikle uygun bir hız-parametre oranı sağlar. Ancak bu özel mimariler katı olabilir ve örnek segmentasyonu gibi yeni görevlere uyarlanmaları karmaşık olabilir. RepGFPN boyun kısmı, çok ölçekli özellik birleştirmeyi iyileştirir ancak yeniden parametrelendirme dışa aktarma aşamasında karmaşıklık ekler.
PP-YOLOE+, daha geleneksel ancak oldukça etkili olan CSPRepResNet'e güvenir. Bu ana gövde, benzer doğruluk için DAMO-YOLO'dan daha büyük bir parametre alanı gerektirse de, eğitilmesi oldukça kararlıdır ve mevcut işlem hatlarına entegre edilmesi daha kolaydır. ET-head yapısı sınıflandırma ve regresyonu verimli bir şekilde yönetir ancak yine de Maksimum Olmayan Baskılama (NMS) gibi işlem sonrası adımlar gerektirir.
Hem DAMO-YOLO hem de PP-YOLOE+, sınırlayıcı kutuların işlem sonrası süreci için NMS gerektirir. Eğer çıkarım gecikmesi kritikse, yerel olarak Uçtan Uca NMS'siz Tasarım özelliğine sahip Ultralytics YOLO26 kullanmayı düşün. Bu çığır açan yaklaşım, daha hızlı ve daha basit bir dağıtım işlem hattı için NMS sonrası işlemeyi ortadan kaldırır.
Performans ve Ölçüm Analizi
Bu modelleri üretim için değerlendirirken, doğruluk (mAP), çıkarım hızı ve parametre boyutu arasındaki denge çok kritiktir. Aşağıda, birincil varyantlarının doğrudan bir karşılaştırması yer almaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Tablonun gösterdiği gibi, DAMO-YOLO, NAS optimize edilmiş ana gövdeleri sayesinde küçük (s) ve küçük (t) ölçeklerde genellikle daha düşük gecikme süresi elde eder. Ancak PP-YOLOE+, orta (m) ve büyük (l) seviyelerde inanılmaz derecede iyi ölçeklenir ve T4 TensorRT hızında küçük bir maliyet pahasına önemli ölçüde daha yüksek mAP puanlarına sahip olur.
Bellek Gereksinimleri ve Eğitim Verimliliği
DAMO-YOLO'nun damıtmaya olan bağımlılığı, daha küçük öğrenci modelini eğitmeden önce genellikle çok daha büyük bir öğretmen modeli eğitmen gerekeceği anlamına gelir. Bu, CUDA bellek gereksinimlerini ve genel hesaplama bütçesini büyük ölçüde artırır. PP-YOLOE+ bunu standart tek aşamalı eğitimle basitleştirir ancak PyTorch'a alışkın ekipler için esnekliği sınırlayabilecek olan PaddlePaddle çerçevesine sıkı sıkıya bağlı kalır.
Buna karşılık, modern Ultralytics YOLO26 modeli bu darboğazları çözer. LLM eğitimindeki yeniliklerden esinlenen SGD ve Muon'un bir hibriti olan yeni MuSGD Optimizer kullanan YOLO26, karmaşık damıtma işlem hatlarına gerek kalmadan daha hızlı yakınsama ve oldukça kararlı bir eğitim elde eder. Ayrıca YOLO modelleri, RT-DETR gibi transformer tabanlı dedektörlere kıyasla eğitim sırasında genellikle çok daha az CUDA belleği gerektirir.
Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları
Ne zaman DAMO-YOLO kullanmalı
DAMO-YOLO, gecikmenin nihai darboğaz olduğu yüksek verimli uç çıkarım için idealdir. Küçük varyantları, mühendislik ekibinin karmaşık damıtma ve yeniden parametrelendirme süreçlerini yönetme kapasitesi olduğu sürece trafik yönetimi sistemleri veya temel drone gözetimi gibi ortamlarda mükemmel performans gösterir.
PP-YOLOE+ ne zaman kullanılmalı?
PP-YOLOE+, zaten Baidu ekosistemine derinlemesine yatırım yapmışsan veya büyük ölçekli sunucu dağıtımları yapıyorsan parlar. Etkileyici mAP değeri, onu karmaşık tıbbi görüntü analizi veya yoğun üretim kusur tespiti için uygun kılar.
Ultralytics Avantajı
Hem DAMO-YOLO hem de PP-YOLOE+ belirli yerel avantajlar sunsa da, maksimum çok yönlülük, hız ve kullanım kolaylığı arayan geliştiriciler sürekli olarak Ultralytics Platform kullanmayı tercih eder.
Bilgisayarlı görü işlem hattını yükseltirken, Ultralytics YOLO26 benzersiz bir geliştirici deneyimi sunar:
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağılımsal Odak Kaybı (DFL) tamamen kaldırılarak, YOLO26 uç CPU'larda ve düşük güç tüketen IoT cihazlarında oldukça hızlıdır.
- Geliştirilmiş Küçük Nesne Tespiti: ProgLoss ve STAL kayıp fonksiyonlarının entegrasyonu, hava görüntüleri için hayati öneme sahip olan küçük nesne tanımada çarpıcı iyileştirmeler sağlar.
- Kapsamlı Çok Yönlülük: Sadece tespiti odak noktasına alan PP-YOLOE+'ın aksine, YOLO26 göreve özgü mimari iyileştirmelerle poz tahmini, yönlendirilmiş sınırlayıcı kutular (OBB) ve anlamsal segmentasyonu sorunsuz bir şekilde yönetir.
Sonuç
DAMO-YOLO ve PP-YOLOE+, çapasız nesne tespitinin gelişiminde önemli kilometre taşlarını temsil eder. DAMO-YOLO uç gecikme için sinirsel mimari aramanın sınırlarını zorlarken, PP-YOLOE+ büyük ölçekli ön eğitimin gücünü kanıtladı.
Ancak, hız, doğruluk ve dağıtım basitliğinin en iyi dengesini arayan geliştiriciler için Ultralytics YOLO26 modeli kesin tercihtir. NMS'siz mimarisi, güçlü Python API'si ve Weights & Biases ve TensorRT gibi araçlarla sorunsuz entegrasyonu, projelerinin prototipten üretime sorunsuz bir şekilde geçmesini sağlar.
Başlamaya hazır mısın? Ultralytics Hızlı Başlangıç Kılavuzunu keşfet veya YOLO11 vs DAMO-YOLO genel bakışımızda daha fazla model karşılaştır.