İçeriğe geç

PP-YOLOE+ - YOLOv6-3.0: Ayrıntılı Teknik Karşılaştırma

Modern nesne algılama mimarileri dünyasında gezinmek genellikle belirli çerçeve ekosistemleri için optimize edilmiş modeller ile ham endüstriyel hız için tasarlanmış olanlar arasında seçim yapmayı içerir. Bu kapsamlı analiz, PaddlePaddle paketinden yüksek doğruluklu, ankrajsız bir algılayıcı olan PP-YOLOE+ ile Meituan tarafından gerçek zamanlı endüstriyel uygulamalar için tasarlanmış, hıza odaklı bir model olan YOLOv6-3.0'ı karşılaştırır. Geliştiriciler, mimarilerini, performans metriklerini ve ideal kullanım durumlarını inceleyerek hangi modelin dağıtım kısıtlamalarıyla en iyi şekilde uyum sağladığını belirleyebilir.

PP-YOLOE+: Anchor'suz Hassasiyet

PP-YOLOE+, PaddlePaddle ekosistemi içinde doğruluğun sınırlarını zorlamak için Baidu araştırmacıları tarafından geliştirilen PP-YOLO serisinin evrimini temsil eder. 2022'nin başlarında piyasaya sürülen bu ürün, genel amaçlı bilgisayarla görme görevleri için son teknoloji performansı sunarken eğitim hattını basitleştirmek için ankrajsız bir tasarıma odaklanmaktadır.

Yazarlar: PaddlePaddle Yazarları
Kuruluş:Baidu
Tarih: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
Belgeler:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

Mimari ve Temel Yenilikler

PP-YOLOE+'nın mimarisi, Artık Ağların özellik çıkarma yeteneklerini Çapraz Aşamalı Kısmi (CSP) bağlantılarının verimliliğiyle birleştiren CSPRepResNet backbone üzerine kurulmuştur. Geleneksel dedektörlerden önemli bir sapma, önceden tanımlanmış bağlantı kutularına olan ihtiyacı ortadan kaldıran bağlantısız başlığıdır. Hiperparametrelerdeki bu azalma, model yapılandırmasını basitleştirir ve çeşitli veri kümelerinde genellemeyi iyileştirir.

Önemli olarak, PP-YOLOE+, sınıflandırma ve yerelleştirme görevleri arasındaki uyumsuzluğu çözmek için Görev Hizalama Öğrenimi'ni (TAL) kullanır—tek aşamalı detector'lerde yaygın bir sorun. TAL, tahminlerin kalitesine göre etiketleri dinamik olarak atayarak, en yüksek güven skorlarının en doğru sınırlayıcı kutulara karşılık gelmesini sağlar.

Güçlü ve Zayıf Yönler

Güçlü Yönler:

  • Yüksek Hassasiyet: Özellikle daha büyük model varyantlarında (örneğin, PP-YOLOE+x) COCO gibi kıyaslamalarda sürekli olarak üstün mAP skorları elde eder.
  • Basitleştirilmiş Eğitim: Anchor'suz paradigma, anchor boyutlandırması için kümeleme analizlerinin karmaşıklığını ortadan kaldırır.
  • Ekosistem Sinerjisi: Zaten PaddlePaddle derin öğrenme çerçevesine yerleşmiş kullanıcılar için derin entegrasyon sunar.

Zayıflıklar:

  • Çıkarım Gecikmesi: Genellikle, özellikle GPU donanımında YOLOv6 gibi donanım farkındalıklı modellere kıyasla daha yavaş çıkarım hızları sergiler.
  • Framework Bağımlılığı: Dağıtım için modelleri PyTorch veya ONNX gibi diğer frameworklere taşımak, yerel olarak frameworkten bağımsız mimarilere kıyasla daha fazla sürtünmeye neden olabilir.

İdeal Kullanım Senaryoları

PP-YOLOE+, doğruluğun ultra düşük gecikmeye göre öncelikli olduğu durumlarda sıklıkla tercih edilen seçimdir.

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLOv6-3.0: Endüstriyel Hız için Tasarlandı

YOLOv6-3.0, Meituan'daki vizyon yapay zeka ekibi tarafından endüstriyel uygulamaların zorlu taleplerini karşılamak üzere tanıtıldı. Çıkarım hızı ve doğruluk arasındaki dengeye öncelik veren YOLOv6, GPU'lar ve uç cihazlarda verimi en üst düzeye çıkarmak için donanım farkındalığına sahip tasarım prensiplerini kullanır.

Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş:Meituan
Tarih: 2023-01-13
ArXiv:https://arxiv.org/abs/2301.05586
GitHub:https://github.com/meituan/YOLOv6
Belgeler:https://docs.ultralytics.com/models/yolov6/

Mimari ve Temel Özellikler

YOLOv6-3.0, modelin zengin özellikler öğrenmek için eğitim sırasında karmaşık bir yapıya sahip olmasına, ancak hız için çıkarım sırasında basitleştirilmiş bir yapıya sahip olmasına olanak tanıyan, RepVGG'den ilham alan bir "Verimli Yeniden Parametrelendirme Omurgası"na sahiptir. Bu yeniden parametrelendirme tekniği, gerçek zamanlı çıkarım yeteneklerinin anahtarıdır.

Model ayrıca, daha büyük bir öğretmen modelinin daha küçük bir öğrenci modelinin eğitimine rehberlik ettiği, çalışma zamanında hesaplama maliyeti eklemeden doğruluğu artıran kendi kendine damıtmayı da kullanır. Ayrıca, YOLOv6 agresif model nicemlemesini destekleyerek, sınırlı işlem kaynaklarına sahip donanımlarda dağıtım için oldukça etkili hale getirir.

Mobil Optimizasyon

YOLOv6, GPU hızlandırmasının kullanılamadığı durumlarda hızı korumak için farklı bloklar kullanan, mobil CPU'lar için optimize edilmiş belirli bir "Lite" model serisi içerir.

Güçlü ve Zayıf Yönler

Güçlü Yönler:

  • Olağanüstü Hız: YOLOv6-3.0n modelinin T4 GPU'larda 2 ms'nin altında gecikme süresine ulaşmasıyla, yüksek verim için açıkça tasarlanmıştır.
  • Donanım Optimizasyonu: Mimari, GPU kullanımını en üst düzeye çıkararak TensorRT optimizasyonuna uygundur.
  • Verimli Ölçeklendirme: Hesaplama maliyeti (FLOP'lar) için iyi bir doğruluk dengesi sağlar.

Zayıflıklar:

  • Sınırlı Görev Kapsamı: Öncelikli olarak algılama için tasarlanmıştır; poz tahmini veya yönlendirilmiş sınırlayıcı kutular (OBB) gibi karmaşık görevler için yerel desteğe sahip değildir.
  • Topluluk Desteği: Etkili olmasına rağmen, ekosistem üçüncü taraf entegrasyonları ve topluluk eğitimleri konusunda Ultralytics modellerine kıyasla daha az aktiftir.

İdeal Kullanım Senaryoları

YOLOv6-3.0, tepki süresinin kritik olduğu ortamlarda mükemmeldir.

  • Robotik: Otonom mobil robotlar (AMR'ler) için navigasyon ve etkileşimi etkinleştirme.
  • Trafik Analizi: Anında araç sayımı ve sınıflandırması gerektiren gerçek zamanlı trafik yönetimi sistemleri.
  • Üretim Hatları: Paket segmentasyonu ve sıralama için yüksek hızlı taşıma bandı izleme.

YOLOv6 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Tasarım felsefesindeki ayrım (PP-YOLOE+ için doğruluk odağına karşılık YOLOv6 için hız odağı), performans metriklerinde açıkça görülmektedir. PP-YOLOE+, genellikle model karmaşıklığının üst ucunda daha yüksek mAP puanları alırken, YOLOv6 daha küçük, daha hızlı modeller için ham çıkarım hızında baskındır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Not: Metrik karşılaştırmaları, kullanılan belirli donanıma ve dışa aktarma biçimine (örneğin, ONNX - TensorRT karşılaştırması) büyük ölçüde bağlıdır.

Veriler, kaynak kısıtlı uç nokta uygulamaları için YOLOv6-3.0n'nin FLOPs ve gecikme açısından en düşük giriş engelini sunduğunu göstermektedir. Tersine, maksimum algılama yeteneğinin gerekli olduğu sunucu tarafı uygulamalar için PP-YOLOE+x en yüksek doğruluk tavanını sağlar.

Ultralytics'in Avantajı: YOLO11

PP-YOLOE+ ve YOLOv6 kendi nişlerinde güçlü yetenekler sunarken, Ultralytics YOLO11 yüksek doğruluk ve kullanım kolaylığı arasındaki boşluğu dolduran bütünsel bir çözüm sağlar. YOLO11 sadece bir model değil, tüm makine öğrenimi yaşam döngüsünü kolaylaştırmak için tasarlanmış, iyi yönetilen bir ekosisteme bir giriş noktasıdır.

Neden Ultralytics'i Seçmelisiniz?

  • Rakipsiz Çok Yönlülük: Temelde bir algılayıcı olan YOLOv6'nın aksine, YOLO11 doğal olarak örnek segmentasyonu, poz tahmini, OBB ve sınıflandırmayı destekler. Bu, geliştiricilerin tek bir API ile çok yönlü bilgisayar görüşü sorunlarının üstesinden gelmelerini sağlar.
  • Kullanım Kolaylığı: Ultralytics Python paketi, karmaşık ortak kodları soyutlar. Bir modeli yüklemek, çıkarım çalıştırmak ve sonuçları görselleştirmek üç satır kodla yapılabilir.
  • Verimlilik ve Bellek: Ultralytics modelleri verimli eğitim için optimize edilmiştir ve genellikle RT-DETR gibi transformatör tabanlı mimarilerden önemli ölçüde daha az GPU belleği gerektirir.
  • Ekosistem Desteği: Sık güncellemeler, kapsamlı dokümantasyon ve kodsuz eğitim için Ultralytics HUB gibi araçlarla, kullanıcılar sektörle birlikte gelişen bir platformdan yararlanır.

Basitleştirilmiş Dağıtım

Ultralytics, erişilebilirliğe öncelik verir. Gelişmiş çıkarımı hemen çalıştırabilirsiniz:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Bu basitlik, ONNX, OpenVINO ve CoreML gibi formatlara tek satırlık dışa aktarma yetenekleriyle dağıtıma kadar uzanır ve modelinizin herhangi bir hedef donanımda optimum şekilde performans göstermesini sağlar.

YOLO11 hakkında daha fazla bilgi edinin

Sonuç

PP-YOLOE+ ve YOLOv6-3.0 arasındaki seçim büyük ölçüde projenizin özel kısıtlamalarına bağlıdır. PP-YOLOE+, PaddlePaddle çerçevesi içinde yüksek hassasiyet gerektiren senaryolar için güçlü bir rakiptir, YOLOv6-3.0 ise GPU çıkarımına büyük ölçüde dayanan endüstriyel ortamlar için zorlayıcı hız avantajları sunar.

Ancak, son teknoloji performansı geliştirici deneyimiyle dengeleyen, çok yönlü, geleceğe dönük bir çözüm arayan geliştiriciler için Ultralytics YOLO11 üstün öneri olmaya devam ediyor. Kapsamlı görev desteği, aktif topluluğu ve modern MLOps iş akışlarına sorunsuz entegrasyonu, onu en son teknolojiye sahip görsel yapay zeka için standart haline getiriyor.

Diğer Model Karşılaştırmaları

İhtiyaçlarınıza uygun modeli bulmak için daha ayrıntılı karşılaştırmaları inceleyin:


Yorumlar