Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 ile PP-YOLOE+ karşılaştırması#

Gerçek zamanlı nesne algılama dünyası hızla gelişmeye devam ediyor ve bilgisayarlı görü mühendislerine, uç ve bulut altyapılarında yüksek doğruluklu modeller dağıtmak için çok çeşitli seçenekler sunuyor. Bu alandaki iki öne çıkan model YOLOv9 ve PP-YOLOE+'dır. Her ikisi de doğruluk ve hız sınırlarını zorlasa da, farklı araştırma geçmişlerinden ve yazılım ekosistemlerinden gelmektedirler.

Bu kapsamlı teknik karşılaştırma; mimarilerini, eğitim metodolojilerini, performans metriklerini ve ideal gerçek dünya uygulamalarını inceliyor. Ayrıca, daha geniş Ultralytics ekosisteminin, kullanım kolaylığına, bellek verimliliğine ve çok yönlü dağıtıma öncelik veren geliştiriciler için nasıl önemli avantajlar sağladığını da inceleyeceğiz.

Link to this sectionModel Kökenleri ve Teknik Özellikler#

Bu modellerin geçmişini anlamak, mimari kararlarını ve çerçeve bağımlılıklarını bağlam içine oturtmana yardımcı olur.

Link to this sectionYOLOv9: Bilgi Darboğazını Çözmek#

2024'ün başlarında tanıtılan YOLOv9, derin sinir ağlarından bilgi akışı sırasında meydana gelen veri kaybını ele alıyor. Parametre verimliliğini en üst düzeye çıkarmak için tasarlanmış, yüksek düzeyde optimize edilmiş bir evrişimli sinir ağıdır.

YOLOv9 hakkında daha fazla bilgi edin

Link to this sectionPP-YOLOE+: Paddle Ekosistemini İlerletmek#

2022 yılında Baidu tarafından yayınlanan PP-YOLOE+, PP-YOLOv2 üzerinde yapılan yinelemeli bir iyileştirmedir. Çapasız (anchor-free) bir paradigma kullanır ve PaddlePaddle çerçevesi içinde yakınsamayı ve doğruluğu artırmak için dinamik bir etiket atama stratejisi sunar.

PP-YOLOE+ hakkında daha fazla bilgi edinin

Link to this sectionMimari Karşılaştırma#

Link to this sectionProgramlanabilir Gradyan Bilgisi (PGI) ile CSPRepResStage karşılaştırması#

YOLOv9'daki temel yenilik Programlanabilir Gradyan Bilgisidir (PGI). PGI, eğitim sırasında hayati önem taşıyan gradyan bilgilerinin korunmasını ve sığ katmanlara doğru bir şekilde geri aktarılmasını sağlayan bir yardımcı denetim çerçevesi görevi görür. Bu, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek, hesaplama maliyetini (FLOPs) önemli ölçüde azaltırken yüksek doğruluk sağlayan Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) ile eşleştirilmiştir.

PP-YOLOE+, CSPRepResStage adlı özel bir omurga yapısına dayanır. Dağıtım sırasında evrişimli katmanları birleştirerek çıkarımı hızlandırmak için (RepVGG'de görülenlere benzer) yeniden parametrelendirme tekniklerinden yararlanır. Ayrıca, sınıflandırma ve regresyon görevlerini dengelemek için Verimli Görev uyumlu başlık (ET-head) kullanır.

PP-YOLOE+ sağlam olsa da, YOLOv9'un GELAN mimarisi hem eğitim hem de çıkarım sırasında genellikle daha küçük bir bellek alanı gerektirir, bu da onu uç AI cihazları için son derece uygun hale getirir.

Link to this sectionPerformans Karşılaştırması#

Üretim için modelleri değerlendirirken, mAP (ortalama Hassasiyet), çıkarım hızı ve model boyutu arasındaki denge çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this sectionAnaliz#

  • Parametre Verimliliği: YOLOv9 çok daha yüksek verimlilik sağlar. Örneğin, YOLOv9c yalnızca 25.3M parametre kullanarak %53.0 mAP değerine ulaşırken, PP-YOLOE+l %52.9'luk biraz daha düşük bir mAP değerine ulaşmak için parametrelerin iki katından fazlasına (52.2M) ihtiyaç duyar. Bu durum, YOLOv9 için bellek gereksinimlerini önemli ölçüde düşürür.
  • Çıkarım Hızı: YOLOv9 modelleri, TensorRT gibi donanım hızlandırıcıları için mükemmel optimizasyon sergiler ve NVIDIA T4 GPU'larda gerçek zamanlı çıkarım için kritik olan rekabetçi çıkarım hızları sağlar.

Link to this sectionEğitim Metodolojileri ve Ekosistem#

Bu modeller arasındaki seçim genellikle yazılım ekosistemine bağlıdır.

Link to this sectionPP-YOLOE+ ve PaddlePaddle#

PP-YOLOE+, PaddleDetection paketi ile sıkı bir şekilde entegredir. Güçlü olmasına rağmen, kullanıcıların yapılandırma ağırlıklı, komut satırı odaklı bir ortamda gezinmelerini gerektirir. PyTorch veya TensorFlow ekosistemlerine derinden entegre olmuş ekipler için, PaddlePaddle'a geçiş önemli ölçüde sürtünme yaratır ve öğrenme eğrisi daha diktir.

Link to this sectionUltralytics Avantajı: Kolaylaştırılmış İş Akışları#

Buna karşılık YOLOv9, oldukça gelişmiş Ultralytics ekosistemi içinde çalışır. Geliştiriciler ve araştırmacılar için tasarlanan Ultralytics, olağanüstü bir kullanım kolaylığına öncelik verir. Python API, karmaşık ortak kodları tamamen soyutlar.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run inference and visualize results
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for production deployment
model.export(format="onnx")

Bu iş akışı, Ultralytics modellerinin üstün Eğitim Verimliliğini öne çıkarır. Veri artırma, dağıtık eğitim ve Weights & Biases veya MLflow gibi platformlara otomatik günlük kaydı için yerel destek standart olarak gelir.

Vision AI'daki Yenilikleri Keşfet

YOLOv9 olağanüstü bir performans sunsa da, yeni projeler için yeni yayınlanan Ultralytics YOLO26 modelini değerlendirmeni şiddetle tavsiye ederiz. YOLO26, dağıtımı büyük ölçüde basitleştiren yerel bir Uçtan Uca NMS'siz Tasarıma sahiptir. DFL Kaldırma (basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güç cihazı uyumluluğu için Distribution Focal Loss kaldırılmıştır) ile uç bilişim için %43'e kadar daha hızlı CPU çıkarımı sağlar. MuSGD Optimize Edici ile güçlendirilmiş olup, istikrarlı eğitim ve hızlı yakınsama sağlar. Ayrıca, ProgLoss + STAL, IoT, robotik ve hava görüntüleri için kritik olan küçük nesne tanımada kayda değer iyileştirmelerle geliştirilmiş kayıp fonksiyonları sunar.

Link to this sectionÇok Yönlülük ve Görev Desteği#

Modern bilgisayarlı görü projeleri nadiren basit sınırlayıcı kutularla (bounding boxes) sınırlı kalır.

PP-YOLOE+, öncelikli olarak standart nesne algılama için tasarlanmıştır. Mimarisini diğer görevlere uyarlamak, kapsamlı özel mühendislik gerektirir.

Buna karşılık Ultralytics çerçevesi, çok görevli bir güç merkezidir. Birleştirilmiş bir API kullanarak geliştiriciler, standart nesne algılamadan karmaşık Örnek Segmentasyonu, son derece hassas Poz Tahmini, hava görüntüleri için Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılaması ve Görüntü Sınıflandırması işlemlerine zahmetsizce geçiş yapabilirler. Bu benzersiz çok yönlülük, kurumsal ekiplerin neden tutarlı bir şekilde YOLOv9, YOLO11 ve YOLO26 gibi Ultralytics modellerini seçtiğinin sebebidir.

Link to this sectionİdeal Kullanım Senaryoları ve Uygulamalar#

  • Akıllı Şehir Analitiği ve Trafik Yönetimi: YOLOv9 (ve sonraki YOLO26) modellerinin yüksek parametre verimliliği ve düşük gecikme süresi, trafik akışını ve kentsel güvenliği izlemek için kısıtlı uç donanımlarda (NVIDIA Jetson cihazları gibi) dağıtım için onları ideal kılar.
  • Perakende Envanter Sistemleri: Raflardaki yoğun küçük ürün yapılandırmalarını tespit etmek için YOLOv9'un PGI'sı, küçük nesne algılama görevlerinde PP-YOLOE+'dan daha iyi performans göstererek ince taneli mekansal ayrıntıları etkili bir şekilde korur.
  • Eski Dağıtımlar: PP-YOLOE+, yalnızca mevcut eski altyapıda Baidu/PaddlePaddle yazılım yığınını kullanması zorunlu olan ekipler için geçerli bir seçenek olmaya devam etmektedir.

Transformer tabanlı mimarileri araştıran araştırmacılar için Ultralytics, tam olarak aynı kullanımı kolay API içinde RT-DETR modelini de yerel olarak destekler; böylece özel dağıtım gereksinimlerin için en uygun modele her zaman erişebileceğinden emin olursun.

Yorumlar