PP-YOLOE+ ve YOLOv9: Modern Nesne Algılamaya Teknik Bir Bakış

Gerçek zamanlı bilgisayarlı görü alanı sürekli değişiyor; araştırmacılar ve geliştiriciler doğruluk ve çıkarım hızı sınırlarını sürekli zorluyor. PP-YOLOE+ ve YOLOv9 modellerini karşılaştırırken, model mimarisi ve ekosistem tasarımı konusunda iki farklı felsefeyi inceliyoruz.

Bu kapsamlı teknik karşılaştırma, mimari yeniliklerini, performans metriklerini, eğitim metodolojilerini ve ideal kullanım senaryolarını analiz ederek bir sonraki dağıtımın için doğru nesne algılama modelini seçmene yardımcı olur.

Model Soy Ağacı ve Teknik Temeller

Bu modellerin kökenlerini ve mimari tercihlerini anlamak, bilgisayarlı görü projelerine ne kadar uyumlu olduklarını belirlemek için çok önemlidir.

PP-YOLOE+ Genel Bakış

Baidu'daki PaddlePaddle Yazarları tarafından geliştirilen PP-YOLOE+, 2 Nisan 2022'de tanıtıldı. Yüksek performanslı nesne algılama sağlamak için PaddleDetection çerçevesindeki önceki yinelemelerin üzerine inşa edilmiştir.

PP-YOLOE+, PaddlePaddle ekosisteminde dağıtım için yoğun şekilde optimize edilmiş, sağlam ve çapasız (anchor-free) bir mimari sunar. Özellik çıkarma ve sınırlayıcı kutu regresyonunu iyileştirmek için değiştirilmiş bir CSPRepResNet omurgası ve bir ET-head kullanır. Yüksek ortalama Hassasiyet (mAP) elde etmesine rağmen, PaddlePaddle çerçevesine olan bağımlılığı, PyTorch veya TensorFlow'a alışkın geliştiriciler için bazen entegrasyon zorlukları yaratabilir.

PP-YOLOE+ hakkında daha fazla bilgi edin

YOLOv9 Genel Bakış

Tayvan, Academia Sinica Bilgi Bilimleri Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından tanıtılan YOLOv9, derin öğrenme bilgi darboğazlarını verimli bir şekilde yönetme konusunda önemli bir sıçramayı temsil eder.

  • Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
  • Organizasyon: Institute of Information Science, Academia Sinica, Tayvan
  • Tarih: 2024-02-21
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

YOLOv9'un en büyük yeniliği, özellikler derin sinir ağlarından geçerken veri kaybını önleyen Programlanabilir Gradyan Bilgisi (PGI) teknolojisidir. Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) ile birleştirilen YOLOv9, parametre verimliliğini ve hesaplama akışını maksimize eder. Ayrıca, Ultralytics ekosistemine yerel olarak entegre edilmiştir, bu da onu hem araştırma hem de ticari uygulamalar için son derece erişilebilir kılar.

YOLOv9 hakkında daha fazla bilgi edin

Diğer Ultralytics Modelleri

En son teknolojileri keşfediyorsan, transformer tabanlı hassasiyet ile gerçek zamanlı uç performansının farklı dengelerini sunan YOLO11 ve RT-DETR modelleri de ilgini çekebilir.

Performans ve Metrik Karşılaştırması

Ham performansı analiz ettiğimizde, YOLOv9 olağanüstü bir parametre verimliliği sergiler. Daha az parametre ve FLOP gerektirerek benzer veya daha üstün bir doğruluk elde eder, bu da model eğitimi sırasında daha düşük VRAM gereksinimleri anlamına gelir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Tabloda görüldüğü gibi YOLOv9c, karşılaştırılabilir PP-YOLOE+l modeline (52,2M) kıyasla çok daha az parametre (25,3M) ile 53,0 mAP gibi güçlü bir sonuç elde eder. Bu düşük bellek kullanımı, YOLOv9'u kısıtlı GPU kaynaklarıyla çalışan geliştiriciler için daha üstün bir seçenek haline getirir.

Ekosistem, Çok Yönlülük ve Kullanım Kolaylığı

YOLOv9'un belirleyici avantajı, bakımlı Ultralytics ekosistemiyle olan kusursuz entegrasyonunda yatar. PP-YOLOE+ karmaşık PaddlePaddle yapılandırma dosyalarında gezinmeyi gerektirirken, YOLOv9 modern bir Python API'sinin avantajlarından yararlanır.

Ultralytics Python API, geliştiricilerin önceden eğitilmiş ağırlıkları yüklemesine, veri artırmayı yönetmesine ve minimal kod satırlarıyla eğitimi başlatmasına olanak tanır.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

Ayrıca Ultralytics ekosistemi benzersiz bir çok yönlülük sağlar. Sınırlayıcı kutu algılamasının ötesinde, çerçeve yerel olarak Örnek Segmentasyonu, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamasını destekler. Bu, modelini karmaşık gerçek dünya boru hatlarına uyarlamayı inanılmaz derecede verimli hale getirir.

Dışa Aktarma Seçenekleri

Ultralytics çerçevesi kullanılarak eğitilen modeller, TensorRT ve OpenVINO dahil olmak üzere birçok formata aktarılabilir ve bu sayede farklı donanımlarda son derece optimize edilmiş çıkarım sağlanır.

Kullanım Durumları ve Öneriler

PP-YOLOE+ ve YOLOv9 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

PP-YOLOE+ Ne Zaman Seçilmeli

PP-YOLOE+ şunlar için güçlü bir tercihtir:

  • PaddlePaddle Ekosistemi Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip kuruluşlar.
  • Paddle Lite Uç Dağıtımı: Paddle Lite veya Paddle çıkarım motoru için özel olarak optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım yaparken.
  • Yüksek Doğruluklu Sunucu Tarafı Algılama: Çerçeve bağımlılığının bir sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğuna öncelik veren senaryolar.

Ne Zaman YOLOv9 Seçilmeli

YOLOv9 şunlar için önerilir:

  • Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
  • Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
  • Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

İleriye Bakış: YOLO26 Avantajı

Hem PP-YOLOE+ hem de YOLOv9 güçlü olsa da, yeni yayınlanan YOLO26 üretim ortamları için kesin bir sonraki adımı temsil eder. Ocak 2026'da piyasaya sürülen YOLO26, uç bilişim ve bulut dağıtımları için yeni bir standart belirler. Çığır açan yenilikleri nedeniyle tüm yeni bilgisayarlı görü projeleri için YOLO26 kullanmanı şiddetle öneririz:

  • Uçtan Uca NMS-Free Tasarım: YOLO26 yerel olarak uçtan ucadır ve Non-Maximum Suppression (NMS) işlem sonrası ihtiyacını tamamen ortadan kaldırır. Bu, dağıtım boru hatlarını önemli ölçüde basitleştirir ve gecikmeyi azaltır.
  • %43'e Varan Daha Hızlı CPU Çıkarımı: Mimarinin uç bilişim için özel olarak optimize edilmesi sayesinde YOLO26, özel GPU'lara sahip olmayan donanımlarda önemli ölçüde daha hızlıdır.
  • DFL Kaldırıldı: Dağılım Odaklı Kayıp (Distribution Focal Loss) kaldırılmıştır, bu da dışa aktarmaları daha basit hale getirir ve düşük güçlü uç cihazlarla uyumluluğu önemli ölçüde artırır.
  • MuSGD Optimize Edici: (Moonshot AI'ın Kimi K2'si gibi) büyük dil modeli eğitim tekniklerinden esinlenen bu SGD ve Muon hibriti, son derece kararlı eğitim dinamikleri ve hızlı yakınsama sağlar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntüleme ve robotik için kritik bir yükseltme olan küçük nesne tanımada kayda değer iyileştirmeler sağlar.
  • Göreve Özel İyileştirmeler: YOLO26, segmentasyon için çok ölçekli proto ve poz tahmini için Kalıntı Log-Olabilirlik Tahmini (RLE) gibi belirli görevlere yönelik özelleştirilmiş mimariler içerir.

Veri seti ek açıklama, bulut eğitimi ve model izleme için hepsi bir arada bir çözüm olan Ultralytics Platform aracılığıyla YOLO26 modellerini kolayca eğitebilir ve dağıtabilirsin.

Gerçek Dünya Uygulamaları

Bu mimariler arasında seçim yapmak genellikle hedef dağıtım ortamına bağlıdır.

PP-YOLOE+, özellikle PaddlePaddle entegrasyonunun ve Baidu'nun donanım yığınının kurumsal altyapıya derinlemesine yerleştiği bölgelerdeki endüstriyel üretim merkezlerinde sıklıkla kullanılır. Mutlak hassasiyetin katı gerçek zamanlı kısıtlamalardan daha öncelikli olduğu statik görüntü analizinde mükemmel sonuçlar verir.

YOLOv9, hızlı gerçek zamanlı çıkarım gerektiren dinamik ortamlarda üstündür. Üstün parametre verimliliği, onu otonom drone navigasyonu ve uç tabanlı güvenlik sistemleri için ideal kılar. Ayrıca, daha düşük VRAM tüketimi, tüketici sınıfı GPU'larda eğitim yapan araştırmacılar için giriş engelini düşürür.

Akıllı şehir trafik yönetimi ve yüksek hızlı robotik genelinde mutlak en iyi performans için, daha yeni olan YOLO26 rakipsizdir ve NMS darboğazlarının yükü olmadan uçtan uca verimlilik sunar.

Yorumlar