DAMO-YOLO ve PP-YOLOE+: Teknik Bir Karşılaştırma
En uygun nesne algılama mimarisinin seçilmesi, bilgisayarla görme projelerinin verimliliğini, doğruluğunu ve ölçeklenebilirliğini etkileyen çok önemli bir karardır. Bu kapsamlı karşılaştırma, öne çıkan iki modeli analiz etmektedir: Alibaba'nın hız odaklı dedektörü YOLO ve Baidu'nun PaddlePaddle ekosisteminden yüksek hassasiyetli bir model olan PP-YOLOE+. Geliştiricilerin bilinçli seçimler yapmasına yardımcı olmak için benzersiz mimarilerini, performans ölçümlerini ve ideal dağıtım senaryolarını inceliyoruz.
YOLO: Alibaba'dan Hız Odaklı İnovasyon
Alibaba Group tarafından geliştirilen YOLO, verimli nesne algılamada önemli bir sıçramayı temsil ediyor. Kaynak kısıtlaması olan cihazlarda performansı optimize etmek için Sinirsel Mimari Arama (NAS) gibi gelişmiş tekniklerden yararlanarak üstün bir hız-doğruluk dengesine öncelik verir.
Teknik Detaylar:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Organizasyon:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
- Dokümanlar:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO hakkında daha fazla bilgi edinin
Mimari ve Temel Özellikler
YOLO , birçok ileri teknolojiyi bir araya getiren modüler tasarım felsefesiyle öne çıkmaktadır:
- MAE-NAS Backbone: ResNet gibi standart omurgalar kullanan geleneksel modellerin aksine, YOLO bir backbone Nöral Mimari Arama (NAS) yoluyla keşfedilmiştir. Bu, özellik çıkarma verimliliği için matematiksel olarak optimize edilmiş bir yapı ile sonuçlanır.
- Verimli RepGFPN: Model, yeniden parametrelendirme (Rep) teknikleriyle geliştirilmiş bir Genelleştirilmiş Özellik Piramidi Ağı (GFPN) kullanır. Bu boyun mimarisi, çıkarım sırasında gecikmeyi en aza indirirken farklı ölçeklerde özellik füzyonunu geliştirir.
- ZeroHead Teknolojisi: Öne çıkan bir özellik, algılama kafasının hesaplama yükünü önemli ölçüde azaltan "ZeroHead" tasarımıdır. Sınıflandırma ve regresyon görevlerini daha etkili bir şekilde ayrıştırarak, hassasiyetten ödün vermeden parametrelerden tasarruf sağlar.
- AlignedOTA Etiket Ataması: Eğitim sırasında YOLO , sınıflandırma ve regresyon hedefleri arasında daha iyi uyum sağlayan ve daha hızlı yakınsamaya yol açan dinamik bir etiket atama stratejisi olan AlignedOTA'yı kullanır.
Kompakt Modeller için Distilasyon
YOLO , daha küçük varyantları (Tiny, Small) için Bilgi Damıtmayı yoğun bir şekilde kullanır. Bilgiyi daha büyük bir "öğretmen" modelinden daha küçük bir "öğrenci" modeline aktararak, bu tür hafif mimariler için tipik olarak mümkün olandan daha yüksek doğruluk elde eder.
PP-YOLOE+: PaddlePaddle içinde Hassas Mühendislik
PP-YOLOE+, Baidu araştırmacıları tarafından geliştirilen YOLO serisinin evrimleşmiş halidir. PaddlePaddle derin öğrenme çerçevesi için özel olarak optimize edilmiş, COCO veri kümesi gibi standart ölçütlerde doğruluk sınırlarını zorlamak için tasarlanmış, çapasız, tek aşamalı bir dedektördür.
Teknik Detaylar:
- Yazarlar: PaddlePaddle Yazarları
- Organizasyon:Baidu
- Tarih: 2022-04-02
- Arxiv:https://arxiv.org/abs/2203.16250
- GitHub:https://github.com/PaddlePaddle/PaddleDetection/
- Dokümanlar:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
PP-YOLOE+ hakkında daha fazla bilgi edinin
Mimari ve Temel Özellikler
PP-YOLOE+ arıtma ve yüksek hassasiyetli bileşenlere odaklanır:
- Çapasız Mekanizma: PP-YOLOE+, çapasız bir yaklaşım benimseyerek hiperparametre ortamını basitleştirir ve çapa kutularını manuel olarak tasarlama ihtiyacını ortadan kaldırır.
- CSPRepResNet: backbone , Çapraz Aşamalı Kısmi ağları (CSPNet) yeniden parametreli artık bloklarla birleştirerek gradyan akışı ve hesaplama maliyetini dengeleyen sağlam bir özellik çıkarıcı sunar.
- Görev Hizalama Öğrenimi (TAL): Bu yöntem, sınıflandırma puanını yerelleştirme kalitesiIoU) ile açıkça hizalayarak yüksek güvenirlikli tespitlerin aynı zamanda yüksek kaliteli sınırlayıcı kutulara sahip olmasını sağlar.
- ET-Head: Efficient Task-aligned Head (ET-Head), sınıflandırma ve yerelleştirme görevlerinin ayrılmasını daha da optimize ederek modelin yüksek mAP puanlarına katkıda bulunur.
Performans Analizi: Metrikler ve Verimlilik
YOLO ve PP-YOLOE+ karşılaştırılırken genellikle saf çıkarım hızı ile mutlak doğruluk arasında bir denge kurulur. YOLO , GPU donanımında daha hızlı olacak şekilde tasarlanırken PP-YOLOE+, genellikle artan model boyutu ve FLOP'lar pahasına üst düzey doğruluğu hedefler.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Güçlü ve Zayıf Yönler
YOLO:
- Güçlü yönleri: Olağanüstü gerçek zamanlı çıkarım hızları, gecikmenin kritik olduğu video işleme ve uç dağıtımları için idealdir. NAS tabanlı mimari, verimli kaynak kullanımı sağlar.
- Zayıf yönler: Uygulama, daha yerleşik kütüphanelere kıyasla standart üretim hatlarına entegre edilmesi daha zor olabilen belirli araştırma kod tabanlarına derinden bağlıdır.
PP-YOLOE+:
- Güçlü yönleri: Özellikle 'x' (ekstra büyük) varyantı ile çok yüksek doğruluk tavanları. PaddlePaddle ekosistemi ile entegrasyon, halihazırda bu ortamda bulunan kullanıcılar için kapsamlı bir araç paketi sağlar.
- Zayıf yönler: PaddlePaddle çerçevesine daha fazla bağımlılık, standartlaştırılmış ekipler için bir engel olabilir PyTorch. YOLO'ya kıyasla benzer çıkarım hızları için genellikle daha fazla parametre gerektirir.
Kullanım Alanları ve Uygulamalar
Mimari farklılıklar, her model için ideal kullanım durumlarını belirler:
- YOLO, Edge Yapay Zeka ve Robotik alanlarında mükemmeldir. Düşük gecikme süresi, ortamlarda gezinmek veya engellerden kaçınmak için görsel verileri anında işlemesi gereken dronlar veya otonom mobil robotlar (AMR'ler) için mükemmeldir.
- PP-YOLOE+, Endüstriyel Denetim ve Detaylı Analitik için çok uygundur. Üretim kalite kontrolü veya tıbbi görüntü analizi gibi senaryolarda, küçük bir kusuru kaçırmanın biraz daha yavaş bir çıkarım süresinden daha maliyetli olduğu durumlarda, PP-YOLOE+'nun daha yüksek mAP 'si değerlidir.
Ultralytics Avantajı: Neden YOLO11'i Seçmelisiniz?
Hem YOLO hem de PP-YOLOE+ belirli faydalar sağlarken, Ultralytics YOLO11 performans, kullanılabilirlik ve ekosistem desteğini dengeleyen bütünsel bir çözüm sunar. Çoğu geliştirici için YOLO11 , bilgisayarla görmeyi üretime taşımak için en pratik ve güçlü seçeneği temsil ediyor.
YOLO11 hakkında daha fazla bilgi edinin
Eşsiz Çok Yönlülük ve Ekosistem
Özel dedektörlerin aksine, YOLO11 çok modlu bir güç merkezidir. Nesne algılama, örnek segmentasyonu, poz tahmini, sınıflandırma ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama gibi çok çeşitli görevleri tek bir birleşik çerçeve içinde destekler.
- Kullanım Kolaylığı: Ultralytics , basit, sezgisel bir Python API ile geliştirici deneyimine öncelik verir. Modelleri yalnızca birkaç satır kodla eğitebilir, doğrulayabilir ve dağıtabilirsiniz, bu da araştırma odaklı modellerin sıklıkla ihtiyaç duyduğu karmaşık yapılandırmalara kıyasla geliştirme süresini önemli ölçüde azaltır.
- Performans Dengesi: YOLO11 , olağanüstü hız ile son teknoloji ürünü doğruluğa ulaşır. Güçlü bulut GPU'larından NVIDIA Jetson gibi uç cihazlara kadar çeşitli donanımlarda verimli bir şekilde çalışacak şekilde optimize edilmiştir ve birçok transformatör tabanlı alternatiften daha düşük bellek kullanır.
- Eğitim Verimliliği: Çerçeve, optimize edilmiş eğitim rutinleri ve önceden eğitilmiş ağırlıklardan oluşan geniş bir kütüphane içerir. Bu, özel veri kümeleri üzerinde hızlı ince ayar yapılmasına olanak tanıyarak hesaplama maliyetlerinden ve zamandan tasarruf sağlar.
Kolaylaştırılmış İş Akışı
Ultralytics ekosistemi, araştırmadan üretime sorunsuz geçişler için tasarlanmıştır. Aktif bakım, sık güncellemeler ve TensorRT ve OpenVINO gibi araçlarla entegrasyonlar sayesinde geliştiriciler modelleri güvenle dağıtabilir.
Örnek: YOLO11 'i Python ile Çalıştırma
YOLO11 ile çalışmaya başlamak kolaydır. Aşağıdaki kod parçacığı, önceden eğitilmiş bir modelin nasıl yükleneceğini ve bir görüntü üzerinde çıkarımın nasıl çalıştırılacağını göstermektedir:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on a local image source
results = model("path/to/image.jpg")
# Display the inference results
results[0].show()
Bu basitlik, sağlam performansla birleştiğinde Ultralytics YOLO11 'i ölçeklenebilir ve sürdürülebilir yapay zeka çözümleri oluşturmak isteyen geliştiriciler için tercih edilen seçenek haline getiriyor.
Sonuç
Hem YOLO hem de PP-YOLOE+ bilgisayarla görme alanına önemli katkılarda bulunmuştur. YOLO , verimlilik için Sinirsel Mimari Aramasının gücünü gösterirken PP-YOLOE+, PaddlePaddle ekosistemindeki çapasız tasarımlarla mümkün olan hassasiyeti vurgulamaktadır.
Bununla birlikte, hız, doğruluk ve kullanım kolaylığı arasında optimum bir denge sunan çok yönlü, üretime hazır bir çözüm için, Ultralytics YOLO11 üstün öneri olmaya devam ediyor. Birden fazla görüntü görevi için kapsamlı desteği, düşük bellek alanı ve kapsamlı dokümantasyonu, geliştiricilerin daha hızlı ve daha etkili bir şekilde yenilik yapmalarını sağlar.
Diğer Karşılaştırmaları İnceleyin
- DAMO-YOLO ve YOLOv8 Karşılaştırması
- PP-YOLOE+ vs. YOLOv10
- DAMO-YOLO ve RT-DETR Karşılaştırması
- YOLO11 vs. YOLOv9