DAMO-YOLO ve PP-YOLOE+: Teknik Bir Karşılaştırma
Doğru nesne algılama modelini seçmek, doğruluk, çıkarım hızı ve hesaplama maliyeti arasında bir denge kuran kritik bir karardır. Bu sayfa, Alibaba Group tarafından geliştirilen DAMO-YOLO ve Baidu tarafından geliştirilen PP-YOLOE+ arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Geliştiricilerin ve araştırmacıların bilgisayar görüşü projeleri için bilinçli bir seçim yapmalarına yardımcı olmak için mimarilerini, performans metriklerini ve ideal kullanım durumlarını analiz edeceğiz.
Her iki model de önemli gelişmeler sunarken, Ultralytics YOLO serisi gibi alternatifleri de göz önünde bulundurmak önemlidir. Ultralytics YOLO11 gibi modeller, araştırmadan üretime kadar geliştirmeyi hızlandıran kullanıcı dostu ve iyi yönetilen bir ekosistemle birlikte, performans ve verimliliğin son derece rekabetçi bir dengesini sağlar.
DAMO-YOLO: Alibaba'dan Hızlı ve Doğru Bir Yöntem
DAMO-YOLO, Alibaba Group tarafından hız ve doğruluk arasında üstün bir denge sağlamak için çeşitli yeni tekniklerden yararlanan hızlı ve doğru bir nesne algılama yöntemi olarak tanıtıldı. YOLO felsefesi üzerine inşa edilmiştir, ancak performans sınırlarını zorlamak için gelişmiş bileşenler içerir.
Teknik Detaylar:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444
- GitHub: https://github.com/tinyvision/DAMO-YOLO
- Belgeler: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO hakkında daha fazla bilgi edinin
Mimari ve Temel Özellikler
DAMO-YOLO'nun mimarisi, Nöral Mimari Arama (NAS) ve diğer optimizasyonlar yoluyla keşfedilen en son tekniklerin entegrasyonu ile ayırt edilir.
- NAS Destekli Backbone'ler: DAMO-YOLO, Alibaba'nın MAE-NAS'ı tarafından oluşturulan backbone'leri kullanır ve bu da nesne algılama için özel olarak tasarlanmış, yüksek verimli özellik çıkarıcılarla sonuçlanır.
- Verimli RepGFPN Katmanı: Düşük gecikmeyi korurken farklı ölçeklerdeki özellik kaynaştırmasını geliştirmek için yeniden parametrelendirme ile Genelleştirilmiş Özellik Piramidi Ağı (GFPN) olan yeni bir katman sunar.
- ZeroHead: Model, sınıflandırma ve regresyon görevlerini ayrıştıran, hesaplama yükünü azaltan ve performansı artıran basitleştirilmiş, sıfır parametreli bir başlık kullanır.
- AlignedOTA Etiket Atama: Dinamik ve hizalamaya odaklı bir etiket atama stratejisi olan AlignedOTA, eğitim sırasında en uygun bağlantı noktalarının seçilmesini sağlayarak daha hassas tahminlere yol açar.
- Damıtma Geliştirmesi: DAMO-YOLO, daha büyük, daha güçlü öğretmen modellerinden daha küçük öğrenci modellerine bilgi aktarmak için bilgi damıtma yöntemini kullanarak çıkarım maliyetini artırmadan doğruluklarını artırır.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Mükemmel Hız-Doğruluk Takası: DAMO-YOLO, çok hızlı çıkarım hızlarında yüksek doğruluk sağlamada mükemmeldir ve bu da onu gerçek zamanlı uygulamalar için ideal kılar.
- Hesaplama Açısından Verimli: Model, parametreler ve FLOP'lar açısından hafif olacak şekilde tasarlanmıştır; bu da kaynak kısıtlamalı cihazlarda dağıtım için faydalıdır.
- Yenilikçi Mimari: NAS, RepGFPN ve ZeroHead kullanımı, verimli model tasarımında önemli bir adımı temsil eder.
Zayıflıklar:
- Ekosistem Entegrasyonu: Model öncelikle MMDetection tabanlı bir çerçeve içinde uygulanır ve bu da standart PyTorch iş akışlarına entegre etmek için ek çaba gerektirebilir.
- Topluluk Desteği: Bir şirket laboratuvarının araştırma odaklı bir modeli olduğundan, daha yaygın olarak benimsenen modellere kıyasla daha küçük bir topluluğa ve daha az üçüncü taraf kaynağına sahip olabilir.
PP-YOLOE+: PaddlePaddle Ekosistemi İçinde Yüksek Doğruluk
Baidu tarafından geliştirilen PP-YOLOE+, PP-YOLOE serisinin geliştirilmiş bir versiyonudur. Özellikle PaddlePaddle derin öğrenme çatısı içinde makul verimliliği korurken yüksek doğruluk elde etmeye öncelik veren bir anchor-free, tek aşamalı tespit aracıdır.
Teknik Detaylar:
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş: Baidu
- Tarih: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Belgeler: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
PP-YOLOE+ hakkında daha fazla bilgi edinin
Mimari ve Temel Özellikler
PP-YOLOE+, performansı artırmayı amaçlayan çeşitli önemli iyileştirmelerle sağlam bir anchor içermeyen temel üzerine inşa edilmiştir.
- Anchor'sız Tasarım: PP-YOLOE+, önceden tanımlanmış anchor kutularını ortadan kaldırarak algılama hattını basitleştirir ve ayarlanması gereken hiperparametrelerin sayısını azaltır.
- CSPRepResNet Backbone: Güçlü ancak verimli bir özellik çıkarıcı oluşturmak için CSPNet ve RepVGG prensiplerini birleştiren güçlü bir backbone kullanır.
- Gelişmiş Kayıp ve Başlık: Model, sınıflandırma ve yerelleştirme görevlerini daha iyi hizalamak ve algılama hassasiyetini artırmak için Varifocal Kayıp ve verimli bir ET-Head (Efficient Task-aligned Head - Verimli Görev Hizalı Başlık) içerir.
- PaddlePaddle Optimizasyonu: PP-YOLOE+, PaddlePaddle çatısı için derinlemesine entegre edilmiş ve optimize edilmiştir ve bu ekosistemdeki kullanıcılar için sorunsuz eğitim, çıkarım ve dağıtım sunar.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Yüksek Doğruluk: PP-YOLOE+'nin daha büyük varyantları, COCO veri kümesinde son teknoloji doğruluğu elde eder.
- Ölçeklenebilir Modeller: Çeşitli boyutlarda (t, s, m, l, x) mevcuttur ve kullanıcıların kendi özel hesaplama bütçelerine uyan bir model seçmelerine olanak tanır.
- Güçlü Ekosistem Desteği: PaddleDetection araç seti içinde iyi belgelenmiş ve desteklenmektedir.
Zayıflıklar:
- Çerçeve Bağımlılığı: Öncelikle PaddlePaddle çerçevesine dayanması, PyTorch üzerinde standartlaşmış geliştiriciler ve ekipler için önemli bir engel olabilir.
- Daha Az Verimli: DAMO-YOLO ile karşılaştırıldığında, PP-YOLOE+ modelleri genellikle benzer bir doğruluk seviyesi için daha fazla parametreye ve daha yüksek FLOP'lara sahiptir, bu da onları daha fazla işlem gücü gerektirir.
Performans Analizi: DAMO-YOLO - PP-YOLOE+ Karşılaştırması
DAMO-YOLO ve PP-YOLOE+'nın performansı, farklı tasarım felsefelerini vurgulamaktadır. DAMO-YOLO, daha iyi bir hız-doğruluk dengesi sunarak maksimum verimlilik için tasarlanmıştır. Buna karşılık, PP-YOLOE+, özellikle daha büyük modelleriyle, daha yüksek hesaplama gereksinimleri pahasına doğruluğun sınırlarını zorlamaya odaklanmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Tablodan şunları gözlemleyebiliriz:
- Doğruluk (mAP): PP-YOLOE+x, %54,7'lik en yüksek mAP'ye ulaşarak tüm DAMO-YOLO varyantlarını geride bırakır. Ancak, daha küçük ölçeklerde DAMO-YOLO modelleri oldukça rekabetçidir.
- Hız: DAMO-YOLO modelleri, benzer boyuttaki PP-YOLOE+ modellerine kıyasla bir T4 GPU'da sürekli olarak daha hızlı çıkarım hızları gösterir.
- Verimlilik (Parametreler ve FLOP'lar): DAMO-YOLO genellikle daha verimlidir. Örneğin, DAMO-YOLOm, 28,2M parametre ile %49,2 mAP elde ederken, biraz daha doğru olan PP-YOLOE+m (%49,8 mAP) 23,43M parametre gerektirir ancak daha yavaştır. En büyük PP-YOLOE+x modeli, hem parametreler hem de FLOP'lar açısından önemli ölçüde daha büyüktür.
Ultralytics Avantajı: Neden YOLO11'i Seçmelisiniz?
DAMO-YOLO ve PP-YOLOE+ güçlü modeller olmasına rağmen, ekosistem kısıtlamalarıyla birlikte gelirler. Çok yönlü, kullanımı kolay ve yüksek performanslı bir çözüm arayan geliştiriciler için Ultralytics YOLO11 olağanüstü bir alternatiftir.
Ultralytics modelleri, geliştirici deneyimi en yüksek öncelik olacak şekilde tasarlanmıştır. Temel avantajları şunlardır:
- Kullanım Kolaylığı: Kolaylaştırılmış bir Python API'si, kapsamlı dokümantasyon ve basit bir CLI, eğitimi, doğrulamayı ve dağıtımı inanılmaz derecede kolaylaştırır.
- İyi Yönetilen Ekosistem: Ultralytics, aktif geliştirme, GitHub üzerinde güçlü topluluk desteği ve uçtan uca MLOps için Ultralytics HUB ile entegrasyon içeren sağlam bir ekosistem sunar.
- Çok Yönlülük: Özel dedektörlerin aksine, YOLO11, kullanıma hazır nesne algılama, segmentasyon, sınıflandırma ve poz tahmini özelliklerini destekleyen çok görevli bir modeldir.
- Eğitim Verimliliği: Ultralytics YOLO modelleri, verimli eğitim için optimize edilmiştir ve genellikle daha az bellek ve zaman gerektirir. Herhangi bir projeye hızlı bir başlangıç yapmak için zengin bir önceden eğitilmiş ağırlık kümesi mevcuttur.
Sonuç: Sizin İçin Hangi Model Doğru?
DAMO-YOLO ve PP-YOLOE+ arasındaki seçim büyük ölçüde projenizin özel önceliklerine ve mevcut teknoloji yığınına bağlıdır.
-
DAMO-YOLO'yu Seçin, öncelikli hedefiniz özellikle uç cihazlarda gerçek zamanlı çıkarım için mümkün olan en iyi hız-doğruluk dengesini elde etmekse. Hesaplama verimliliğine değer veren ve MMDetection tabanlı çerçevesiyle çalışmaktan rahat olanlar için mükemmel bir seçimdir.
-
PP-YOLOE+'yı Seçin, uygulamanız mümkün olan en yüksek doğruluğu gerektiriyorsa ve zaten Baidu PaddlePaddle ekosisteminde çalışıyorsanız veya benimsemeyi planlıyorsanız. Daha büyük modelleri, hassasiyetin çok önemli olduğu yüksek riskli uygulamalar için idealdir.
-
Çoğu geliştirici ve araştırmacı için Ultralytics YOLO11'i öneriyoruz. Yüksek performansın, çoklu görme görevlerindeki çok yönlülüğün ve benzersiz bir kullanım kolaylığının zorlayıcı bir kombinasyonunu sunar. Sağlam, iyi yönetilen ekosistem, çerçeveye özgü modellerle ilişkili sürtünmeyi ortadan kaldırarak, yenilikçi yapay zeka çözümleri oluşturmaya ve dağıtmaya daha hızlı odaklanmanızı sağlar.
Diğer Karşılaştırmaları İnceleyin
- DAMO-YOLO ve YOLOv8 Karşılaştırması
- PP-YOLOE+ - YOLOv10 karşılaştırması
- DAMO-YOLO ve RT-DETR Karşılaştırması
- YOLO11 - YOLOv9 Karşılaştırması