PP-YOLOE+ ve YOLOv9 Karşılaştırması: Modern Nesne Detect'e Teknik Bir Bakış
Gerçek zamanlı bilgisayar görüşü alanı sürekli değişmektedir; araştırmacılar ve geliştiriciler doğruluk ve çıkarım hızı sınırlarını sürekli zorlamaktadır. PP-YOLOE+ ve YOLOv9'u karşılaştırdığımızda, model mimarisi ve ekosistem tasarımında iki farklı felsefeye bakıyoruz.
Bu kapsamlı teknik karşılaştırma, bir sonraki dağıtımınız için doğru nesne algılama modelini seçmenize yardımcı olmak amacıyla mimari yeniliklerini, performans metriklerini, eğitim metodolojilerini ve ideal kullanım senaryolarını analiz etmektedir.
Model Soy Ağacı ve Teknik Temeller
Bu modellerin kökenlerini ve mimari seçimlerini anlamak, bilgisayar görüşü projelerinizdeki uygunluklarını belirlemek için çok önemlidir.
PP-YOLOE+ Genel Bakış
Baidu'daki PaddlePaddle Geliştiricileri tarafından geliştirilen PP-YOLOE+, 2 Nisan 2022'de tanıtıldı. Yüksek performanslı nesne algılama sunmak için PaddleDetection çatısı altındaki önceki yinelemeler üzerine inşa edilmiştir.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş:Baidu
- Tarih: 2022-04-02
- Arxiv:2203.16250
- GitHub:PaddleDetection Deposu
PP-YOLOE+, PaddlePaddle ekosistemi içinde dağıtım için yoğun şekilde optimize edilmiş, sağlam, anchorsız bir mimari sunar. Özellik çıkarımını ve sınırlayıcı kutu regresyonunu iyileştirmek için değiştirilmiş bir CSPRepResNet backbone ve bir ET-head kullanır. Yüksek ortalama Hassasiyet (mAP) elde etse de, PaddlePaddle çerçevesine bağımlılığı, PyTorch veya TensorFlow'a alışkın geliştiriciler için bazen entegrasyon zorlukları yaratabilir.
PP-YOLOE+ hakkında daha fazla bilgi edinin
YOLOv9 Genel Bakış
Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından tanıtılan YOLOv9, derin öğrenme bilgi darboğazlarını verimli bir şekilde ele almada önemli bir sıçramayı işaret ediyor.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
YOLOv9'un en büyük atılımı, özellikler derin sinir ağlarından geçerken veri kaybını önleyen Programlanabilir Gradyan Bilgisi (PGI)'dir. Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) ile birleştiğinde, YOLOv9 parametre verimliliğini ve hesaplama akışını maksimize eder. Ayrıca, Ultralytics ekosistemine doğal olarak entegre edilmiştir, bu da onu hem araştırma hem de ticari uygulamalar için oldukça erişilebilir kılar.
YOLOv9 hakkında daha fazla bilgi edinin.
Diğer Ultralytics Modelleri
En son teknoloji seçeneklerini araştırıyorsanız, dönüştürücü tabanlı hassasiyet ve gerçek zamanlı uç performans arasında değişen dengeler sunan YOLO11 ve RT-DETR ile de ilgilenebilirsiniz.
Performans ve Metrik Karşılaştırması
Ham performans analiz edildiğinde, YOLOv9 olağanüstü parametre verimliliği sergiler. Daha az parametre ve FLOP gerektirirken karşılaştırılabilir veya üstün doğruluk elde eder, bu da model eğitimi sırasında daha düşük VRAM gereksinimlerine dönüşür.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Tabloda görüldüğü gibi, YOLOv9c, karşılaştırılabilir PP-YOLOE+l'den (52.2M) önemli ölçüde daha az parametre (25.3M) ile güçlü bir 53.0 mAP elde eder. Bu daha düşük bellek kullanımı, kısıtlı GPU kaynaklarıyla çalışan geliştiriciler için YOLOv9'u üstün bir seçenek haline getirir.
Ekosistem, Çok Yönlülük ve Kullanım Kolaylığı
YOLOv9'un belirleyici avantajı, iyi yönetilen Ultralytics ekosistemiyle sorunsuz entegrasyonunda yatmaktadır. PP-YOLOE+, karmaşık PaddlePaddle yapılandırma dosyalarında gezinmeyi gerektirirken, YOLOv9, kolaylaştırılmış bir Python API'sinden faydalanır.
Ultralytics Python API'si, geliştiricilere önceden eğitilmiş ağırlıkları yüklemelerine, veri artırmayı yönetmelerine ve minimum şablon kodla eğitimi başlatmalarına olanak tanır.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format
model.export(format="onnx")
Ayrıca, Ultralytics ekosistemi benzersiz bir çok yönlülük sunar. Sınırlayıcı kutu algılamanın ötesinde, çerçeve, doğal olarak Örnek Segmentasyon, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamayı destekler. Bu, modelinizi karmaşık gerçek dünya işlem hatlarına uyarlamayı inanılmaz derecede verimli hale getirir.
Dışa Aktarma Seçenekleri
Ultralytics çerçevesi kullanılarak eğitilen modeller, TensorRT ve OpenVINO dahil olmak üzere birden çok formata dışa aktarılabilir, bu da çeşitli donanımlarda yüksek düzeyde optimize edilmiş çıkarım sağlar.
Kullanım Durumları ve Öneriler
PP-YOLOE+ ve YOLOv9 arasında seçim yapmak, belirli proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.
Ne Zaman PP-YOLOE+ Seçmeli
PP-YOLOE+ için güçlü bir seçenektir:
- PaddlePaddle Ekosistem Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip kuruluşlar.
- Paddle Lite Kenar Dağıtımı: Özellikle Paddle Lite veya Paddle çıkarım motoru için yüksek düzeyde optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım.
- Yüksek Doğruluklu Sunucu Taraflı Algılama: Çerçeve bağımlılığının sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğunu önceliklendiren senaryolar.
YOLOv9 Ne Zaman Tercih Edilmeli?
YOLOv9 şunlar için önerilir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için bir referans noktası olarak gerektiği senaryolar.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
İleriye Bakış: YOLO26 Avantajı
Hem PP-YOLOE+ hem de YOLOv9 güçlü olsa da, yeni çıkan YOLO26, üretim ortamları için kesin bir sonraki adımı temsil etmektedir. Ocak 2026'da piyasaya sürülen YOLO26, uç bilişim ve bulut dağıtımları için yeni bir standart belirliyor. Çığır açan yenilikleri nedeniyle tüm yeni bilgisayar görüşü projeleri için YOLO26'yı şiddetle tavsiye ediyoruz:
- Uçtan Uca NMS'siz Tasarım: YOLO26 doğal olarak uçtan ucadır ve Maksimum Olmayan Bastırma (NMS) sonrası işlemine olan ihtiyacı tamamen ortadan kaldırır. Bu, dağıtım işlem hatlarını önemli ölçüde basitleştirir ve gecikmeyi azaltır.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Mimarinin uç bilişim için özel olarak optimize edilmesiyle, YOLO26, özel GPU'ları olmayan donanımlarda önemli ölçüde daha hızlıdır.
- DFL Kaldırılması: Dağıtım Odak Kaybı kaldırılmıştır, bu da dışa aktarımları basitleştirir ve düşük güçlü uç cihazlarla uyumluluğu önemli ölçüde artırır.
- MuSGD Optimizatörü: Büyük dil modeli eğitim tekniklerinden (Moonshot AI'nin Kimi K2'si gibi) esinlenilen, SGD ve Muon'un bu hibriti, son derece kararlı eğitim dinamikleri ve hızlı yakınsama sağlar.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada kayda değer iyileşmeler sağlar; bu da hava görüntüleri ve robotik için önemli bir yükseltmedir.
- Göreve Özel İyileştirmeler: YOLO26, segmentasyon için çok ölçekli proto ve poz tahmini için Artık Log-Olasılık Tahmini (RLE) gibi belirli görevler için özelleştirilmiş mimariler içerir.
YOLO26 modellerini, veri kümesi açıklama, bulut eğitimi ve model izleme için hepsi bir arada bir çözüm olan Ultralytics Platformu aracılığıyla kolayca eğitebilir ve dağıtabilirsiniz.
Gerçek Dünya Uygulamaları
Bu mimariler arasında seçim yapmak genellikle hedef dağıtım ortamınıza bağlıdır.
PP-YOLOE+ endüstriyel üretim merkezlerinde, özellikle PaddlePaddle entegrasyonunun ve Baidu'nun donanım yığınının kurumsal altyapıya derinlemesine entegre olduğu bölgelerde sıkça kullanılır. Mutlak hassasiyetin katı gerçek zaman kısıtlamalarına göre önceliklendirildiği statik görüntü analizinde üstündür.
YOLOv9, hızlı gerçek zamanlı çıkarım gerektiren dinamik ortamlarda üstün performans gösterir. Üstün parametre verimliliği, onu otonom drone navigasyonu ve uç tabanlı güvenlik sistemleri için ideal kılar. Ayrıca, daha düşük VRAM tüketimi, tüketici sınıfı GPU'larda eğitim yapan araştırmacılar için giriş engelini düşürür.
Akıllı şehir trafik yönetimi ve yüksek hızlı robotik alanlarında mutlak en iyi performans için, yeni YOLO26 rakipsizdir ve NMS darboğazlarının ek yükü olmadan uçtan uca verimlilik sunar.