PP-YOLOE+ ile YOLOv10: Modern Nesne Algılayıcılarının Karşılaştırması

Gerçek zamanlı nesne algılama alanı, yüksek doğruluk ile düşük gecikme süresini dengeleyen modellere olan ihtiyaçtan dolayı hızla gelişmiştir. Bu alana yapılan iki önemli katkı, Baidu tarafından PaddleDetection paketinin bir parçası olarak geliştirilen PP-YOLOE+ ve YOLOv10, Tsinghua Üniversitesi'nin NMS eğitimi tanıtan akademik bir çalışmasıdır.

Bu kılavuz, bu mimarilerin performans ölçütlerini, eğitim metodolojilerini ve çeşitli bilgisayar görme uygulamaları için uygunluklarını inceleyerek ayrıntılı bir teknik karşılaştırma sunmaktadır. Her iki model de etkileyici yetenekler sunarken, Ultralytics ve YOLO26 gibi daha yeni modellerin dağıtım için nasıl daha birleşik ve verimli bir yol sağladığını da vurgulamaktayız.

Model Genel Bakış ve Teknik Özellikler

Her modelin kökenini ve tasarım felsefesini anlamak, belirli mühendislik kısıtlamalarınız için doğru aracı seçmenize yardımcı olur.

PP-YOLOE+

PP-YOLOE+, PP-YOLOE'nin geliştirilmiş bir versiyonudur ve çapa içermeyen mekanizmanın ve eğitim verimliliğinin iyileştirilmesine odaklanmaktadır. PaddlePaddle derinlemesine entegre edilmiştir.

Yazarlar:PaddlePaddle
Kuruluş:Baidu
Tarih: Nisan 2022
Referans:arXiv:2203.16250
Anahtar Mimari: Görev Hizalama Öğrenimi (TAL) etiket atama stratejisi backbone CSPRepResNet backbone kullanır. Standart ankarsız kafa tasarımına dayanır.

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLOv10

YOLOv10 , çıkarım sırasında Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldıran uçtan uca bir tasarım sunarak YOLO önemli bir değişime imza attı.

Yazarlar: Ao Wang, Hui Chen, ve diğerleri.
Kuruluş:Tsinghua Üniversitesi
Tarih: Mayıs 2024
Referans:arXiv:2405.14458
Anahtar Mimari: NMS eğitim için tutarlı çift atamalar ve bütünsel verimlilik-doğruluk odaklı model tasarımı sunar.

YOLOv10 hakkında daha fazla bilgi edinin.

Performans Kıyaslamaları

Aşağıdaki tablo, COCO indeki modelleri karşılaştırmaktadır. Önemli ölçütler arasında Ortalama Hassasiyet (mAP) ve farklı donanım yapılandırmalarında çıkarım hızı bulunmaktadır. YOLOv10 , özellikle parametre sayısında önemli verimlilik artışları olduğunu unutmayın.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

Performans Analizi

YOLOv10 , üstün verimlilik YOLOv10 ve genellikle çok daha az parametre ile benzer veya daha iyi doğruluk elde eder. Örneğin, YOLOv10x, PP-YOLOE+x mAP neredeyse aynı mAP değerine ulaşır, ancak yaklaşık %42 daha az parametre kullanır, bu da onu bellek kısıtlaması olan uç dağıtımlar için çok daha uygun hale getirir.

Mimari Derinlemesine İnceleme

PP-YOLOE+ Tasarım

PP-YOLOE+, PP-YOLOv2'nin sağlam temelleri üzerine inşa edilmiştir. Gradyan akışını iyileştirmek için kalıntı bağlantıları aşamalar arası kısmi ağlarla birleştiren CSPRepResNet backbone ölçeklenebilir bir backbone kullanır. Başlık ankrajsızdır ve YOLOv4 gibi ankraj tabanlı öncüllerine kıyasla hiperparametre arama alanını basitleştirir.

Ancak, PP-YOLOE+ karmaşık son işlem adımlarına dayanmaktadır. Doğru olmasına rağmen, NMS bağımlılık, birçok sınırlayıcı kutunun üst üste bindiği kalabalık sahnelerde gecikme darboğazlarına neden NMS .

YOLOv10 : Uçtan Uca İşleme

YOLOv10 , NMS ortadan kaldırarak bir paradigma değişikliği YOLOv10 . Bunu tutarlı ikili atamalarla başarıyor:

Birden Çok Atama: Eğitim sırasında zengin denetim sinyalleri sağlamak için kullanılır.
Bire Bir Atama: Nesne başına benzersiz tahminler sağlamak için çıkarımda kullanılır.

Bu hizalama, modelin kutuları sıralama ve filtreleme gibi hesaplama yükü olmadan uygulanmasına olanak tanır, bu da gerçek zamanlı uygulamalar için büyük bir avantajdır.

Ekosistem ve Kullanım Kolaylığı

Bir modeli çevreleyen ekosistem, genellikle mimarinin kendisi kadar önemlidir. PaddlePaddle modeller ile Ultralytics modeller arasındaki fark en belirgin şekilde burada ortaya çıkmaktadır.

Ultralytics'in Avantajı

Hem YOLOv10 daha yeni olan YOLO26, Ultralytics Python içinde desteklenir ve geliştiricilere sorunsuz bir deneyim sunar.

Birleştirilmiş API: Tek bir dize argümanını değiştirerek modeller arasında geçiş yapın (örneğin, YOLOv8 den YOLOv10 YOLO26 YOLOv8 ).
Platform Entegrasyonu: Kullanıcılar, Ultralytics kullanarak veri kümelerini yönetebilir, eğitim çalıştırmalarını görselleştirebilir ve birkaç tıklama ile modelleri web ve uç uç noktalarına dağıtabilir.
Geniş İhracat Desteği: PP-YOLOE+ Paddle çıkarım için optimize edilmiş olsa da, Ultralytics yerel olarak ONNX, TensorRT, CoreMLve OpenVINO, daha geniş bir yelpazede dağıtım donanımını kapsar.

from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for broad compatibility
path = model.export(format="onnx")

PP-YOLOE+ İş Akışı

PP-YOLOE+ genellikle PaddlePaddle kurulmasını PaddlePaddle PaddleDetection deposunun klonlanmasını gerektirir. Bu ekosistem güçlüdür, ancak standart PyTorch alışkın kullanıcılar için daha az erişilebilir olabilir. Dışa aktarma işlemi genellikle Paddle Inference motoruna öncelik verir ve bu da genel dağıtım için ek dönüştürme adımları gerektirebilir.

Gelecek: YOLO26

YOLOv10 , NMS kavramı YOLOv10 , yakın zamanda piyasaya sürülen YOLO26 bu yenilikleri daha da geliştirip genişletmiştir.

YOLO26, doğal olarak uçtan uca NMS ve son işlem gecikmeleri olmadan mümkün olan en hızlı çıkarım hızlarını sağlar. SGD Muon'un (LLM eğitiminden esinlenerek) bir karışımı olan MuSGD optimizer özelliği ile istikrarlı bir yakınsama sağlar. Ayrıca, Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasıyla YOLO26, düşük güçlü uç cihazlarda dışa aktarılması ve çalıştırılması önemli ölçüde kolaylaşmıştır.

Hız ve doğruluk açısından en iyisini arayan geliştiriciler için, özellikle ProgLoss ve STALaracılığıyla küçük nesnelerin algılanması için YOLO26 önerilen yükseltme yoludur.

YOLO26 hakkında daha fazla bilgi edinin

Gerçek Dünya Kullanım Durumları

Ne Zaman PP-YOLOE+ Seçmeli

Baidu Cloud Dağıtımı: Altyapınız zaten Baidu Cloud üzerinde kurulmuşsa veya Paddle sunucusu kullanıyorsa, PP-YOLOE+ yerel optimizasyon sunar.
Özel Donanım: Bazı Asya pazarı AI yongaları, PaddlePaddle modeller için özel destek sunmaktadır.

Ultralytics YOLOv10 YOLO26) Ne Zaman Seçmelisiniz?

Kenar Bilişim: YOLO26'da %43'e varan daha hızlı CPU sahip olan bu modeller, Raspberry Pi, Jetson Nano veya mobil dağıtımlar için idealdir.
Karmaşık Görevler: Algılama ötesinde, Ultralytics poz tahmini, örnek segmentasyonu ve yönlendirilmiş nesne algılama (OBB) özelliklerini destekleyerek, tek bir araçla çeşitli sorunları çözmenizi sağlar.
Hızlı Prototipleme: Eğitim ve doğrulamanın kolaylığı, ekiplerin hızlı bir şekilde yineleme yapmasını sağlar; bu, çevik geliştirme ortamlarında çok önemli bir faktördür.

Bellek Verimliliği

Ultralytics YOLO , düşük bellek ayak izleriyle ünlüdür. Büyük miktarda CUDA tüketen transformatör ağırlıklı mimarilerin aksine, YOLO26 gibi verimli YOLO , tüketici sınıfı GPU'larda daha büyük parti boyutlarına izin vererek, üst düzey AI eğitimine erişimi demokratikleştirir.

Sonuç

Hem PP-YOLOE+ hem de YOLOv10 yetenekli YOLOv10 . PP-YOLOE+, PaddlePaddle için güçlü bir seçimdir, YOLOv10 ise NMS tasarımıyla verimlilik sınırlarını YOLOv10 . Ancak, en akıcı geliştirme deneyimi, en geniş donanım desteği ve MuSGD optimizer ve ProgLoss gibi en son teknoloji özellikler için Ultralytics , modern bilgisayar görme mühendisleri için üstün bir seçim olarak öne çıkmaktadır.

Diğer seçenekleri keşfetmek için şunu inceleyin YOLOv8 veya dönüştürücü tabanlı RT-DETR 'yi araştırmayı düşünün.