İçeriğe geç

PP-YOLOE+ ile YOLO26: Son Teknoloji Nesne Algılama

Hızla gelişen bilgisayar görme alanında, doğru nesne algılama mimarisini seçmek, doğruluk, hız ve dağıtım kolaylığı arasında denge sağlamak için çok önemlidir. Bu karşılaştırma, PaddlePaddle PP-YOLOE'sinin geliştirilmiş bir versiyonu olan PP-YOLOE+ ile Ultralytics en son kenar optimizasyonlu çığır açan ürünü YOLO26'yı inceliyor. Her iki model de gerçek zamanlı algılamada önemli kilometre taşlarıdır, ancak farklı ekosistemlere ve dağıtım ihtiyaçlarına hitap ederler.

Görsel Performans Karşılaştırması

Aşağıdaki grafik, PP-YOLOE+ ve YOLO26 arasındaki performans farklarını göstererek, yeni mimarinin gecikme süresi ve doğruluk açısından sağladığı gelişmeleri vurgulamaktadır.

Modele Genel Bakış

PP-YOLOE+

PP-YOLOE+, Baidu'nun PaddlePaddle tarafından geliştirilen PP-YOLOE'nin yükseltilmiş bir sürümüdür. Çapa içermeyen paradigmayı temel alır ve çeşitli donanım platformlarında iyi performans gösteren bulut-kenar birleşik mimariyi sunar. Özellikle PaddlePaddle hassasiyet ve çıkarım hızı arasındaki dengeyi optimize etmeye odaklanır.

PP-YOLOE+ hakkında daha fazla bilgi edinin

YOLO26

YOLO26, Ultralytics tarafından geliştirilen YOLO en son sürümüdür ve uç bilgi işlemde verimliliği yeniden tanımlamak için tasarlanmıştır. Ocak 2026'da piyasaya sürülen bu sürüm, yerel uçtan uca NMS bir mimari sunarak, Non-Maximum Suppression (Maksimum Baskılama) son işlemine olan ihtiyacı ortadan kaldırır. Dağıtım Odak Kaybı'nın (DFL) kaldırılması ve MuSGD optimizasyon aracının tanıtılması gibi önemli optimizasyonlarla YOLO26, CPU'larda ve düşük güç tüketen cihazlarda yüksek hızlı çıkarım için özel olarak tasarlanmıştır.

YOLO26 hakkında daha fazla bilgi edinin

Teknik Mimari ve İnovasyon

Bu iki model arasındaki mimari farklılıklar, belirli görevler için uygunluklarını belirler.

PP-YOLOE+ Mimarisi

PP-YOLOE+, CSPRepResNet backbone çok ölçekli özellik füzyonu için yol toplama ağı (PAN) ile özellik piramidi ağı (FPN) kullanır. Önemli yenilikler şunlardır:

  • Anchor-Free Tasarım: Anchor box hiperparametre ayarlamasını ortadan kaldırarak eğitim sürecini basitleştirir.
  • Görev Uyumlaştırma Öğrenimi (TAL): Sınıflandırma ve yerelleştirme görevlerini açıkça uyumlaştırarak, pozitif örnek seçiminin kalitesini artırır.
  • ET-Head: Doğruluğu korurken hesaplama yükünü azaltan, görev odaklı verimli bir başlık.

Ancak PP-YOLOE+, geleneksel NMS dayanır ve bu, sahnede algılanan nesne sayısına bağlı olarak gecikme değişkenliğine neden olabilir.

YOLO26 İnovasyon

YOLO26, uçtan uca algılama yönünde bir paradigma değişikliğini temsil eder.

  • NMS Tasarım: YOLO26, nesne başına kesinlikle tek bir tahmin üreterek NMS tamamen ortadan kaldırır. Bu, son işlem mantığının bir darboğaz oluşturabileceği uç cihazlarda dağıtım için çok önemlidir.
  • MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitiminden esinlenerek geliştirilen bu SGD Muon (Moonshot AI'dan) melezi, eğitimi stabilize eder ve yakınsamayı hızlandırır.
  • ProgLoss + STAL: Progressive Loss ve Soft Task Alignment Loss'un entegrasyonu, hava görüntüleme ve robotikte yaygın bir zorluk olan küçük nesne algılamada performansı önemli ölçüde artırır.
  • DFL Kaldırma: Dağıtım Odak Kaybını kaldırmak, model grafiğini basitleştirerek ONNX ve TFLite daha temiz ve çeşitli donanım hızlandırıcılarıyla daha uyumlu hale getirir.

MuSGD ile Eğitim İstikrarı

YOLO26'daki MuSGD optimizer, LLM eğitiminin istikrarını bilgisayar görüşüne getiriyor. Momentum ve gradyanları uyarlanabilir bir şekilde yöneterek, kapsamlı hiperparametre ayarlaması ihtiyacını azaltır ve kullanıcıların standart SGD AdamW kıyasla daha az epoch'ta optimum doğruluğa ulaşmasını sağlar.

Performans Metrikleri

Aşağıdaki tablo, COCO setinde PP-YOLOE+ ve YOLO26'nın performansını karşılaştırmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Önemli Çıkarımlar:

  1. Verimlilik: YOLO26 modelleri, daha yüksek doğruluk için tutarlı bir şekilde daha az FLOP ve parametre gerektirir. Örneğin, YOLO26x sadece 55,7 milyon parametre ile 57,5 mAP gibi muazzam bir değer elde ederken, PP-YOLOE+x 54,7 mAP ulaşmak için 98,42 milyon parametre gerektirir.
  2. Çıkarım Hızı: YOLO26, GPU'larda (T4 TensorRT) üstün hız sergilerken, Nano modeli sadece 1,7 ms'lik bir hız sunar. CPU da dikkat çekicidir ve önceki nesillere göre %43'e kadar daha hızlı CPU olanak tanıyarak, özel hızlandırıcıları olmayan cihazlar için ideal bir seçimdir.
  3. Doğruluk: Nano/Tiny'den Extra Large'a kadar tüm ölçeklerde, YOLO26, COCO mAP açısından PP-YOLOE+'dan daha iyi performans gösterir.

Ekosistem ve Kullanım Kolaylığı

Bir model seçerken, çevredeki ekosistem ham metrikler kadar önemlidir.

Ultralytics Ekosistem Avantajı

YOLO26 dahil olmak üzere Ultralytics , birleşik, kullanıcı odaklı bir platformdan yararlanır.

  • Optimize edilmiş API: Tutarlı bir Python , algılama, segmentasyon, poz tahmini, sınıflandırma ve OBB arasında sorunsuz bir şekilde geçiş yapmanızı sağlar.
  • Ultralytics : Ultralytics , bulutta veri kümesi yönetimi, etiketleme ve tek tıklamayla eğitim için kod gerektirmeyen bir çözüm sunar.
  • Dokümantasyon: Kapsamlı ve sık sık güncellenen belgeler, kullanıcılara kurulumdan Raspberry Pi gibi uç cihazlarda dağıtımına kadar her adımda rehberlik eder.
  • Bellek Verimliliği: YOLO26, eğitim sırasında bellek verimliliği sağlayacak şekilde tasarlanmıştır ve bellek açısından yoğun alternatiflere kıyasla tüketici sınıfı GPU'larda daha büyük parti boyutlarına izin verir.

PaddlePaddle Ekosistemi

PP-YOLOE+, Baidu PaddlePaddle derinlemesine entegre edilmiştir. Güçlü olmasına rağmen, PyTorch alışkın kullanıcılar için öğrenme eğrisi daha dik olabilen özel bir araç zinciri (PaddleDetection) gerektirir. PaddlePaddle entegrasyonunun (Baidu Kunlun yongaları gibi) öncelikli olduğu ortamlarda üstün performans gösterir.

Kullanım Alanları ve Uygulamalar

Gerçek Zamanlı Kenar Analitiği

Akıllı kameralar veya dronlar gibi uç cihazlarda çalışan uygulamalar için YOLO26 açık ara kazananıdır. Uçtan uca NMS tasarımı, güvenlik sistemleri için kritik öneme sahip öngörülebilir gecikme süresini garanti eder. Azaltılmış FLOP sayısı, pil ile çalışan donanımlarda verimli bir şekilde çalışmasını sağlar.

Endüstriyel Otomasyon

Kalite kontrol gibi yüksek hassasiyet gerektiren üretim ortamlarında her iki model de kullanılabilir. Ancak, YOLO26'nın ProgLoss işlevi küçük kusurların tespitini iyileştirerek üretim hatlarındaki en ufak kusurları tespit etmede avantaj sağlar.

Karmaşık Görme Görevleri

PP-YOLOE+ öncelikle algılamaya odaklanırken, YOLO26 daha geniş bir görev yelpazesini kullanıma hazır olarak destekler.

Çoklu Görev Çok Yönlülüğü

Farklı görevler için farklı model mimarileri gerektiren PP-YOLOE+'dan farklı olarak, Ultralytics görev başlığını kolayca Ultralytics . Örneğin, yolo26n-pose.pt aynı tanıdık API ile anında kilit nokta algılamasını etkinleştirir.

Kod Örneği: YOLO26 ile Başlarken

Ultralytics Python sayesinde YOLO26'nın eğitimi ve kullanımı son derece basittir. Aşağıdaki kod parçacığı, önceden eğitilmiş bir modeli yüklemeyi ve bir görüntü üzerinde çıkarım yapmayı gösterir.

from ultralytics import YOLO

# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")

# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
for result in results:
    result.show()  # Display predictions on screen
    result.save("output.jpg")  # Save annotated image to disk

Sonuç

Hem PP-YOLOE+ hem de YOLO26, bilgisayar görüşüne etkileyici katkılar sağlamaktadır. PP-YOLOE+, PaddlePaddle zaten yatırım yapmış ekipler için sağlam bir seçenek olmaya devam etmektedir.

Ancak, geliştiricilerin ve araştırmacıların büyük çoğunluğu için Ultralytics üstün bir paket sunmaktadır. Uçtan uca mimarisi, dağıtım süreçlerini basitleştirirken, son teknoloji ürünü doğruluğu ve rekor kıran hızı, onu 2026 için en çok yönlü model haline getirmektedir. Ultralytics sağlam desteği ve Ultralytics gibi özelliklerle birleştiğinde, YOLO26 konseptten üretime kadar geçen süreyi önemli ölçüde kısaltmaktadır.

Diğer modern mimarilerle ilgilenen kullanıcılar için, belgeler ayrıca aşağıdaki gibi mükemmel alternatifleri de kapsamaktadır YOLO11 ve dönüştürücü tabanlı RT-DETRgibi mükemmel alternatifleri de ele almaktadır.


Yorumlar