İçeriğe geç

YOLOv9 PP-YOLOE+: Modern Nesne Algılama Teknolojisine Teknik Bir Bakış

Gerçek zamanlı nesne algılama alanı, daha yüksek doğruluk ve daha düşük gecikme süresi için sürekli bir çabayla tanımlanmaktadır. Bu gelişime önemli katkı sağlayan iki unsur şunlardır YOLOv9ve Baidu'nun PaddlePaddle gelişmiş bir versiyon olan PP-YOLOE+'dır. Bu PaddlePaddle , bilgisayar görme projeleriniz için doğru aracı seçmenize yardımcı olmak amacıyla, bu araçların mimari yeniliklerini, karşılaştırmalı değerlendirmelerini ve çeşitli uygulama senaryolarına uygunluklarını incelemektedir.

Yönetici Özeti

YOLOv9 , Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) aracılığıyla derin ağlarda bilgi kaybının üstesinden gelmeye odaklanmaktadır. Orta düzeyde hesaplama kaynakları ile yüksek doğruluk gerektiren senaryolarda üstün performans gösterir. PP-YOLOE+ ise, PaddlePaddle için derinlemesine optimize edilmiştir ve hassas konum belirleme için ölçek farkında atama ve dinamik etiket atama özelliklerini kullanan bulut-kenar birleşik mimariye sahiptir.

Her iki model de güçlü olmakla birlikte, geliştiriciler genellikle Ultralytics YOLO modellerini tercih ederler.

YOLOv9: Gelişmiş Öğrenme için Programlanabilir Gradyanlar

YOLOv9 , derin sinir ağlarında var olan "bilgi darboğazı" sorununu YOLOv9 . Bu sorunda, özellik haritaları ardışık alt örnekleme işleminden geçerken önemli veriler kaybolur.

Temel Mimari Özellikler

  • Programlanabilir Gradyan Bilgisi (PGI): Ağ ağırlıklarını güncellemek için güvenilir gradyanlar üreten ve derin katmanların kritik semantik bilgileri korumasını sağlayan yardımcı bir denetim çerçevesi.
  • GELAN Mimarisi: Genelleştirilmiş Verimli Katman Toplama Ağı, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek, parametre verimliliğini en üst düzeye çıkarmak için gradyan yolu planlamasını optimize eder.
  • Ultralytics ile entegrasyon: YOLOv9 , Ultralytics tamamen entegre YOLOv9 ve kullanıcıların eğitim, doğrulama ve dağıtım için tanıdık araçlardan yararlanmasına olanak tanır.

YOLOv9 : Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimleri Enstitüsü, Academia Sinica
Tarih: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9

YOLOv9 hakkında daha fazla bilgi edinin.

PP-YOLOE+: PaddleDetection'ın Evrimi

PP-YOLOE+, endüstriyel uygulamalar için sağlam bir temel oluşturmak üzere tasarlanmış, PP-YOLOE'nin geliştirilmiş bir versiyonudur. Bu sistem, algılama kafasını basitleştiren ve çeşitli nesne şekilleri arasında genellemeyi iyileştiren, ankrajsız paradigmaya dayalı olarak geliştirilmiştir.

Temel Mimari Özellikler

  • Çapa İçermeyen Mekanizma: Önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırarak, hiperparametre ayarlamasını azaltır ve düzensiz en boy oranlarına sahip nesnelerde performansı artırır.
  • CSPRepResStage: Eğitim kararlılığı ile çıkarım hızını dengelemek için yeniden parametreleştirme tekniklerini kullanan bir backbone .
  • Görev Uyumlaştırma Öğrenimi (TAL): Sınıflandırma puanını yerelleştirme kalitesiyle açıkça uyumlu hale getiren dinamik bir etiket atama stratejisi olup, yüksek güvenilirlikli tespitlerin uzamsal olarak doğru olmasını sağlar.

PP-YOLOE+ Ayrıntılar: Yazarlar: PaddlePaddle
Kuruluş: Baidu
Tarih: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: PaddlePaddle

Performans Karşılaştırması

Bir model seçerken, hız ve doğruluk arasındaki denge çok önemlidir. Aşağıdaki tablo, nesne algılama için standart bir ölçüt olan COCO indeki performans ölçütlerini göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Analiz

  • Parametre Verimliliği: YOLOv9 , özellikle orta (M) ve kompakt (C) varyantlarda, daha az parametre ile YOLOv9 benzer veya daha yüksek mAP Ortalama Ortalama Hassasiyet) değerleri elde eder. Bu, daha düşük depolama gereksinimleri ve çıkarım sırasında potansiyel olarak daha düşük bellek kullanımı anlamına gelir.
  • Çıkarım Hızı: PP-YOLOE+ T4 GPU'larda rekabetçi hızlar gösterirken, YOLOv9 mimarisi gradyan akışı için yüksek düzeyde optimize edilmiştir, bu da eğitim sırasında daha iyi yakınsama sağlayabilir.
  • Çerçeve Bağımlılığı: YOLOv9 , araştırma ve endüstri için baskın çerçeve olan PyTorch üzerinde yerel olarak YOLOv9 . PP-YOLOE+, PaddlePaddle gerektirir ve bu, PyTorch TensorFlow halihazırda kurulmuş ekipler için sürtüşmeye neden olabilir.

Ultralytics'in Avantajı

Belirli mimarileri karşılaştırmak yararlı olsa da, bir modeli çevreleyen ekosistem genellikle uzun vadeli proje başarısının belirleyici faktörüdür.

Kullanım Kolaylığı ve Ekosistem

YOLOv9 daha yeni olan YOLO26 dahil olmak üzere Ultralytics , anında üretkenlik için tasarlanmıştır. Python , karmaşık kalıplaşmış kodları soyutlayarak geliştiricilerin sadece birkaç satırda modelleri yüklemelerine, eğitmelerine ve dağıtmalarına olanak tanır.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Buna karşılık, PP-YOLOE+ genellikle PaddleDetection'a özgü yapılandırma dosyalarına ve komut satırı arayüzlerine dayanır ve bu da özelleştirme için daha zor bir öğrenme eğrisi gerektirebilir.

Görevler Arası Çok Yönlülük

Ultralytics önemli bir avantajı, basit sınırlayıcı kutu algılamanın ötesinde çok çeşitli bilgisayar görme görevlerini desteklemesidir. Örnek Segmentasyonu, Poz Tahmini veya Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamasına ihtiyacınız olsun, iş akışı tutarlı kalır. Bu çok yönlülük, basit algılamadan karmaşık davranış analizine kadar gelişebilen dinamik projeler için çok önemlidir.

Entegre Dağıtım

Ultralytics , üretime giden yolu Ultralytics . Eğitimli modelleri ONNX, TensorRTve OpenVINO tek bir komutla çalıştırarak, uç cihazlardan bulut sunucularına kadar çeşitli donanımlarla uyumluluğu sağlar.

YOLO26 ile Geleceğe Hazırlık

2026 yılında yeni projeler başlatan geliştiriciler için, YOLO26 verimlilik ve performansın zirvesini temsil ediyor.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, hem YOLOv9 PP-YOLOE+'yı geride bırakan birkaç çığır açan özellik sunar:

  • Uçtan Uca NMS: Non-Maximum Suppression (NMS) son işlemine olan ihtiyacı ortadan kaldırarak, YOLO26 gecikmeyi ve dağıtım karmaşıklığını önemli ölçüde azaltır.
  • CPU için optimize edilmiştir: Dağıtım Odak Kaybı (DFL) ve mimari optimizasyonların kaldırılmasıyla YOLO26, CPU'larda %43'e kadar daha hızlı çıkarım sağlar ve bu da onu uç bilgi işlem için ideal hale getirir.
  • MuSGD Optimizer: LLM eğitiminden esinlenerek geliştirilen MuSGD optimizer, eğitimi stabilize eder ve yakınsamayı hızlandırır.
  • Gelişmiş Kayıp Fonksiyonları: ProgLoss ve STAL'ın birleşimi, hava gözetimi ve tıbbi görüntüleme gibi alanlarda sıkça karşılaşılan bir sorun olan küçük nesnelerin algılanmasını önemli ölçüde iyileştirir.

Kullanım Alanları

Gerçek Zamanlı Üretim Denetimi

Yüksek hızlı montaj hatları için, YOLOv9 mükemmel verim sunar. Ancak, denetim sistemi özel GPU'lar olmadan uç cihazlarda çalışıyorsa (ör. Raspberry Pi veya giriş seviyesi endüstriyel PC'ler), YOLO26, CPU ve transformatör ağırlıklı alternatiflere kıyasla daha düşük bellek ayak izi nedeniyle daha üstün bir seçimdir.

Akıllı Şehir Trafik Yönetimi

PP-YOLOE+, altyapı zaten Baidu'nun ekosistemi üzerine kurulmuşsa, statik trafik kameraları için uygun bir seçenektir. Ancak, araç takibi ve yaya güvenliği analizi gerektiren dinamik sistemler için Ultralytics , yerleşik takip desteği (BoT-SORT, ByteTrack) ve gelişmiş artırma teknikleri sayesinde üstün engel yönetimi sağlar.

Tarımsal İzleme

Hassas tarımda, mahsullerdeki hastalıkları tespit etmek genellikle küçük, ince özellikleri tanımlamayı gerektirir. YOLO26, ProgLoss işleviyle bu alanda üstünlük sağlar ve eski modellerin çapa tabanlı yaklaşımlarına kıyasla küçük nesnelerin konumlandırma doğruluğunu artırır. Ayrıca Ultralytics , derin öğrenme uzmanı olmayan tarım bilimcileri için veri kümesi yönetimini ve model eğitimini basitleştirir.

Sonuç

Hem YOLOv9 PP-YOLOE+, bilgisayar görüşünün gelişmesine önemli katkılar sağlamaktadır. PP-YOLOE+, PaddlePaddle güçlü bir rakip olup, sağlam bir çapa gerektirmeyen algılama özelliği sunmaktadır. YOLOv9 , derin ağlarda bilgi saklama sınırlarını YOLOv9 yüksek verimlilik sağlamaktadır.

Ancak, çoğu geliştirici ve araştırmacı için Ultralytics YOLO performans, kullanım kolaylığı ve çok yönlülük açısından en iyi dengeyi sunmaktadır. YOLO26'nın piyasaya sürülmesiyle kullanıcılar, uçtan uca NMS algılama, daha hızlı CPU ve tüm MLOps yaşam döngüsünü kolaylaştıran kapsamlı bir araç setine erişim elde etmektedir.

Diğer yüksek performanslı modeller hakkında daha fazla bilgi için, YOLO11 ve RT-DETR.


Yorumlar