PP-YOLOE+ ile YOLOv9: Nesne Algılama Mimarilerinin Kapsamlı Karşılaştırması

Gerçek zamanlı nesne algılama, araştırmacıların doğruluk, gecikme süresi ve parametre verimliliği sınırlarını sürekli olarak zorlamasıyla hızla gelişmeye devam ediyor. Bu yolculuktaki iki önemli dönüm noktası, Baidu'daki PaddlePaddle tarafından geliştirilen PP-YOLOE+ ve orijinal YOLOv7 tarafından oluşturulan YOLOv9. Bu karşılaştırma, bu iki güçlü modelin mimari yeniliklerini, performans ölçütlerini ve dağıtım gerçeklerini incelemektedir.

Model Meta Verileri

PP-YOLOE+
Yazarlar: PaddlePaddle
Kuruluş: Baidu
Tarih: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: PaddleDetection Deposu
Belgeler: Resmi PaddleDocs

YOLOv9
Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: YOLOv9
Belgeler: Ultralytics YOLOv9

YOLOv9 hakkında daha fazla bilgi edinin.

Performans Analizi

Bu modelleri karşılaştırırken, geliştiriciler genellikle mAP (ortalama hassasiyet) ve çıkarım hızı arasındaki dengeyi göz önünde bulundururlar. Aşağıdaki tablo, PP-YOLOE+'nın 2022 yılında en gelişmiş ankrajsız dedektör olmasına rağmen, YOLOv9 2024) modelinin daha yeni mimari ilkeler kullanarak üstün parametre verimliliği sağladığını göstermektedir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Önemli çıkarımlar şunlardır:

Parametre Verimliliği: YOLOv9t, PP-YOLOE+t'nin yarısından daha az parametreyle (2,0 milyon karşı 4,85 milyon) rekabetçi bir doğruluk elde eder, bu da onu bellek kısıtlaması olan uç cihazlar için çok daha uygun hale getirir.
Ölçekte Doğruluk: Daha büyük modellerde, YOLOv9e, PP-YOLOE+x'i mAP 55,6%'ya karşı 54,7%) geride bırakırken, önemli ölçüde daha az parametre kullanır (57,3 milyon'a karşı 98,42 milyon).
Hız: YOLOv9 , NVIDIA GPU'larda, özellikle daha küçük varyantlar için son derece rekabetçi çıkarım hızları YOLOv9 .

Mimari Farklılıklar

PP-YOLOE+: Gelişmiş Anchor'suz Detect

PP-YOLOE+, PP-YOLOv2'nin bir evrimidir ve çapa içermeyen bir paradigmayı vurgular. CSPResNet backbone basitleştirilmiş CSPPAN boynu kullanır. Temel özellikleri şunlardır:

Görev Uyumlaştırma Öğrenimi (TAL): Sınıflandırma ve yerelleştirme puanlarının birleşimine dayalı olarak pozitif örnekleri dinamik olarak seçen bir etiket atama stratejisi.
ET-Head: Hız ve doğruluğu dengelemek için tasarlanmış, görev odaklı verimli bir kafa.
Dinamik Eşleştirme: Statik bağlantı atamasına kıyasla eğitim sırasında yakınsama hızını artırır.

YOLOv9: Programlanabilir Gradyan Bilgisi

YOLOv9 , derin ağların veri akışını işleme biçiminde temel değişiklikler YOLOv9 . Derin katmanlardan geçerken verilerin kaybolduğu "bilgi darboğazı" sorununu ele alıyor.

GELAN Mimarisi: Genelleştirilmiş Verimli Katman Toplama Ağı, parametre kullanımını en üst düzeye çıkarmak için CSPNet ve ELAN'ın en iyi özelliklerini bir araya getirir.
PGI (Programlanabilir Gradyan Bilgisi): Bu yeni konsept, ana dal için güvenilir gradyanlar oluşturmak üzere yardımcı bir tersinir dal kullanır ve derin özelliklerin girdi görüntüsü hakkındaki kritik bilgileri muhafaza etmesini sağlar.
Yardımcı Denetim: Segmentasyon modellerinde görülen tekniklere benzer şekilde, YOLOv9 , tahmin hızını etkilemeden performansı artırmak için eğitim sırasında yardımcı başlıklar YOLOv9 (bu başlıklar dağıtım sırasında kaldırılır).

Gradyan Bilgisi Neden Önemlidir?

Çok derin sinir ağlarında, özellikler son katmanlara ulaştığında orijinal girdi verileri "unutulabilir". YOLOv9 PGI özelliği, modelin nesneyi tam olarak anlamasını sağlar. Bu, karmaşık sahnelerde küçük veya örtülü nesneleri algılamada özellikle yararlıdır.

Ekosistem ve Kullanım Kolaylığı

Geliştiriciler için en önemli fark, ekosistem ve iş akışında yatmaktadır.

Ultralytics'in Avantajı

YOLOv9 Ultralytics tamamen entegre YOLOv9 . Bu, aynı basit API'yi kullanarak modeli eğitebilir, doğrulayabilir ve dağıtabilirsiniz. YOLO11 ve YOLO26 için kullanılan aynı basit API'yi kullanarak modeli eğitebilir, doğrulayabilir ve dağıtabilirsiniz.

Temel Avantajlar:

Birleştirilmiş API: Model ağırlık dosyasını değiştirerek Nesne Algılama ve Duruş Tahmini gibi görevler arasında geçiş yapın.
Otomatik MLOps: Ultralytics ile sorunsuz entegrasyon, bulut eğitimi, veri kümesi yönetimi ve tek tıklamayla model dağıtımı sağlar.
Bellek Verimliliği: Ultralytics döngüleri yüksek düzeyde optimize edilmiştir ve genellikle rakip çerçevelere göre daha az VRAM gerektirir. Bu, büyük hesaplama kaynakları gerektiren birçok dönüştürücü tabanlı modele göre önemli bir avantajdır.
Dışa Aktarım Çok Yönlülüğü: Aşağıdakilere dışa aktarım için yerel destek ONNX, OpenVINO, CoreML ve TensorRT yerel destek, modelinizin her yerde çalışmasını TensorRT .

from ultralytics import YOLO

# Load a pretrained YOLOv9c model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for maximum GPU speed
model.export(format="engine")

PP-YOLOE+ İş Akışı

PP-YOLOE+, PaddlePaddle dayanmaktadır. Güçlü olmasına rağmen, birçok araştırmacının tercih ettiği PyTorch iş akışından farklı olan belirli bir ekosistemin benimsenmesini gerektirir. Kurulum genellikle PaddleDetection depo ve yapılandırma dosyalarını manuel olarak yönetmek, bu da pip install ultralytics deneyim.

Kullanım Durumları ve Öneriler

PP-YOLOE+'ya ne zaman bağlı kalmalı?

Eski Entegrasyon: Üretim ortamınız zaten Baidu'nun PaddlePaddle üzerine kurulmuşsa.
Özel Donanım: Yalnızca Paddle Lite için özel olarak optimize edilmiş donanıma dağıtım yapıyorsanız.

Ultralytics YOLO Ne Zaman Seçmelisiniz?

Yeni projelerin büyük çoğunluğu için, YOLOv9 veya daha yeni olan YOLO26 önerilen seçeneklerdir.

Araştırma ve Geliştirme: YOLOv9 PGI mimarisi, gradyan akışını inceleyen araştırmacılar için zengin bir çalışma alanı YOLOv9 .
Ticari Dağıtım: Ultralytics sağlam dışa aktarma seçenekleri, PyTorch C++ üretim uygulamasına geçişi kolaylaştırır. TensorRT veya OpenVINO kullanarak PyTorch prototipinden C++ üretim uygulamasına geçişi kolaylaştırır.
Kenar Bilişim: Üstün parametre verimliliği (FLOPmAP ) ile Ultralytics , drone veya akıllı kameralar gibi pille çalışan cihazlar için idealdir.

İleriye Bakış: YOLO26'nın Gücü

YOLOv9 mükemmel bir model YOLOv9 da, bu alan YOLO26ile daha da ilerlemiştir. Bugün yeni bir projeye başlıyorsanız, YOLO26 hem PP-YOLOE+ hem de YOLOv9 göre birkaç önemli avantaj sunmaktadır.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, bilgisayar görme verimliliğinin en son teknolojisini temsil eder:

Uçtan Uca NMS: Non-Maximum Suppression (NMS) son işlem YOLOv9 PP-YOLOE+ ve YOLOv9 farklı YOLOv9 , YOLO26 doğal olarak NMS. Bu, gecikme değişkenliğini azaltır ve dağıtım süreçlerini önemli ölçüde basitleştirir.
MuSGD Optimizer: LLM eğitimindeki yeniliklerden (Moonshot AI'nın Kimi K2 gibi) ilham alan YOLO26, daha hızlı yakınsama ve daha istikrarlı eğitim çalıştırmaları için MuSGD optimizer'ı kullanır.
Geliştirilmiş Küçük Nesne Algılama: ProgLoss + STAL ile YOLO26, birçok gerçek zamanlı algılayıcının geleneksel zayıf noktası olan küçük nesneleri algılamada mükemmeldir.
CPU : Dağıtım Odak Kaybı (DFL) ve diğer optimizasyonların kaldırılmasıyla YOLO26, %43'e varan daha hızlı CPU ulaşarak, özel NPU'ları olmayan sunucusuz ortamlar veya uç cihazlar için en iyi seçenek haline gelmiştir.

Özet

Hem PP-YOLOE+ hem de YOLOv9 , nesne algılama tarihinin dönüm YOLOv9 . PP-YOLOE+, çapa içermeyen yaklaşımı geliştirirken, YOLOv9 ise PGI aracılığıyla derin denetim kavramlarını YOLOv9 . Ancak, doğruluk, kullanım kolaylığı ve geleceğe dönük dağıtım arasında en iyi dengeyi arayan geliştiriciler için, Ultralytics — YOLOv9 ve devrim niteliğindeki YOLO26'nınöncülüğündeki Ultralytics ekosistemi en sağlam çözümü sunmaktadır.

Daha Fazlasını Keşfet

Diğer mimarilerle ilgileniyor musunuz? Karşılaştırmalarımıza göz atın RT-DETR (dönüştürücü tabanlı) veya YOLO11 karşılaştırmalarımıza göz atarak uygulamanız için en uygun olanı bulun.