PP-YOLOE+ ile YOLOv6. YOLOv6: Gerçek Zamanlı Nesne Algılama Konusuna Derinlemesine Bir Bakış
Gerçek zamanlı nesne algılama alanı, doğruluk ve gecikme sınırlarını zorlayan çerçevelerle birlikte hızla gelişmiştir. Bu alanda iki önemli yeni katılımcı, PaddlePaddle dedektörlerinin bir evrimi olan PP-YOLOE+ ve Meituan'ın endüstri odaklı modeli YOLOv6.0'dır. Her iki mimari de hız ve hassasiyet arasındaki dengeyi optimize etmeyi amaçlamaktadır, ancak soruna farklı tasarım felsefelerine sahip olarak yaklaşmakta ve farklı dağıtım ortamlarını hedeflemektedir.
Modele Genel Bakış
Bu modellerin kökenini anlamak, mimari kararlarını ve ideal kullanım örneklerini netleştirmeye yardımcı olur.
PP-YOLOE+
Yazarlar: PaddlePaddle
Kuruluş:Baidu
Tarih: 2022-04-02
Bağlantılar:Arxiv | GitHub
PP-YOLOE+, Baidu'nun PaddlePaddle tarafından geliştirilen PP-YOLOE'nin optimize edilmiş bir sürümüdür. Anchor-free paradigmasını temel alır, CSPRepResNet backbone iyileştirir backbone yeni bir Görev Hizalama Öğrenimi (TAL) stratejisi sunar. PaddlePaddle sıkı bir şekilde entegre olacak şekilde tasarlanmıştır ve PaddleLite aracılığıyla çeşitli donanım arka uçları için sağlam destek sunar.
YOLOv6-3.0
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş:Meituan
Tarih: 2023-01-13
Bağlantılar:Arxiv | GitHub
Genellikle "Tam Ölçekli Yeniden Yükleme" olarak adlandırılan YOLOv6.YOLOv6, Meituan'ın görsel zeka departmanı tarafından geliştirilmiştir. Sadece FLOP'lara odaklanan akademik araştırma modellerinden farklı olarak, YOLOv6. YOLOv6 gerçek dünyadaki endüstriyel uygulamalar için tasarlanmış olup, özellikle NVIDIA T4 gibi GPU'larda verimi optimize etmektedir. Performansı en üst düzeye çıkarmak için Anchor-Aided Training (AAT) adlı hibrit bir eğitim stratejisi kullanmaktadır.
YOLOv6 hakkında daha fazla bilgi edinin.
Teknik Mimari Karşılaştırması
Bu iki model arasındaki temel farklar, kafa tasarımları, eğitim stratejileri ve backbone yatmaktadır.
PP-YOLOE+ Mimarisi
PP-YOLOE+, özellik çıkarma yeteneği ile çıkarım hızını dengelemek için yeniden parametrelendirilebilir konvolüsyonlar kullanan CSPRepResNet backbone ölçeklenebilir bir backbone kullanır. Önemli bir yenilik, Verimli Görev Uyumlu Başlık (ET-head)dır. Geleneksel tek aşamalı dedektörler genellikle sınıflandırma güvenilirliği ve konumlandırma doğruluğu arasında uyumsuzluk sorunu yaşar. PP-YOLOE+, sınıflandırma ve regresyon puanlarının ağırlıklı bir kombinasyonuna dayalı olarak pozitif örnekleri dinamik olarak seçen bir etiket atama stratejisi olan Görev Uyumlu Öğrenme (TAL) ile bu sorunu çözer.
YOLOv6.0 Mimarisi
YOLOv6.YOLOv6, donanım farkında sinir ağı tasarımına büyük önem vermektedir. RepVGG tarzı bloklarla güçlendirilmiş, özellik birleştirme verimliliğini artıran RepBi-PAN adlı çift yönlü yol birleştirme ağını tanıtmaktadır. v3.0'ın en dikkat çekici özelliği Anchor-Aided Training (AAT) dir. Model, hız için ankarsız bir dedektör olarak kullanılırken, eğitim sırasında ankarsız bir yardımcı dal kullanarak yakınsamayı stabilize eder ve doğruluğu artırır, böylece "her iki dünyanın da en iyisini" elde eder.
Uyarı: Yeniden Parametreleştirme Açıklaması
Her iki model de yapısal yeniden parametrelendirme kullanır. Eğitim sırasında, ağ zengin özellikleri öğrenmek için karmaşık çok dallı yapılar (ResNet bağlantıları gibi) kullanır. Çıkarım sırasında, bu dallar matematiksel olarak tek bir evrişim katmanında birleştirilir. RepVGG tarafından popüler hale getirilen bu teknik, doğruluktan ödün vermeden bellek erişim maliyetlerini önemli ölçüde azaltır ve çıkarım gecikmesini düşürür.
Performans Metrikleri
Aşağıdaki tablo, COCO setinde çeşitli model ölçeklerinin performansını karşılaştırmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv6.YOLOv6, özellikle Nano (n) ölçeğinde GPU (TensorRT ) belirgin bir avantaj sergileyerek, yüksek hacimli video işleme için oldukça etkili olmaktadır. PP-YOLOE+ genellikle daha büyük ölçeklerde benzer veya biraz daha yüksek doğruluk (mAP) elde eder, ancak farklı bir parametre verimlilik profiline sahiptir.
Ultralytics'in Avantajı
PP-YOLOE+ ve YOLOv6. YOLOv6 etkileyici yetenekler sunsa da, birçok geliştirici performans, kullanım kolaylığı ve ekosistem desteği arasında bir denge kurmayı önceliklendirir. İşte burada Ultralytics modeller, özellikle YOLO11 ve en son teknoloji ürünü YOLO26, üstün performans sergiliyor.
Neden Ultralytics'i Seçmelisiniz?
- Kullanım Kolaylığı: Ultralytics , "sıfırdan kahramana" bir deneyim Ultralytics . Karmaşık ortam kurulumları gerektiren araştırma depolarının aksine, Ultralytics basit bir pip yüklemesi ve birleşik bir Python ile erişilebilir.
- İyi Bakımlı Ekosistem: Ultralytics ve GitHub deposu sürekli güncellemeler sunarak en yeni sürücüler, dışa aktarım formatları (ONNX, TensorRT, CoreML) ve donanımlarla uyumluluğu garanti eder.
- Çok yönlülük: YOLOv6 öncelikle bir algılama motoru YOLOv6 da, Ultralytics aynı kütüphane içinde örnek segmentasyonu, poz tahmini, sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) görevlerini Ultralytics .
- Eğitim Verimliliği: Ultralytics , eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir. Bu, transformatör tabanlı modellerle ( RT-DETRgibi) ile keskin CUDA oluşturmaktadır.
YOLO26'nın Gücü
2026 yılının Ocak ayında piyasaya sürülen YOLO26, uç ve bulut dağıtımında verimliliğin zirvesini temsil ediyor. Dağıtım süreçlerinde sıkça karşılaşılan sorunları, birkaç çığır açan özellik ile çözüyor:
- Uçtan Uca NMS Tasarım: YOLO26, Non-Maximum Suppression (NMS) son işlemlerini ortadan kaldırır. Bu, gecikme değişkenliğini azaltır ve dağıtım mantığını basitleştirir; bu kavram, YOLOv10.
- %43'e kadar daha hızlı CPU : Dağıtım Odak Kaybı (DFL) kaldırarak ve mimariyi optimize ederek, YOLO26 CPU'larda önemli ölçüde daha hızlıdır ve bu da onu Raspberry Pi veya cep telefonları gibi cihazlarda uç AI için ideal seçim haline getirir.
- MuSGD Optimizer: LLM eğitim kararlılığından esinlenen MuSGD optimizer ( SGD Muon'un bir karışımı), daha hızlı yakınsama ve kararlı eğitim çalıştırmaları sağlar.
- ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, drone görüntüleri ve IoT sensörleri için kritik öneme sahip küçük nesne algılamasını iyileştirir.
YOLO26 hakkında daha fazla bilgi edinin
Kod Örneği
Ultralytics ile son teknoloji ürünü bir modeli eğitmek çok Ultralytics :
from ultralytics import YOLO
# Load the latest YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Kullanım Durumları ve Gerçek Dünya Uygulamaları
Doğru modeli seçmek genellikle projenizin özel kısıtlamalarına bağlıdır.
PP-YOLOE+ için ideal
- Statik Görüntü Analizi: Gecikmenin mutlak hassasiyetten daha az önemli olduğu ortamlar, örneğin şehir planlaması için yüksek çözünürlüklü uydu görüntülerinin analizi.
- PaddlePaddle : Baidu'nun yığınını diğer AI görevleri için halihazırda kullanan ekipler, entegrasyonun sorunsuz olduğunu göreceklerdir.
YOLOv6.0 için ideal
- Endüstriyel Denetim: Hızlı hareket eden konveyör bantlarında kusur tespiti gerektiren yüksek hızlı üretim hatları. Yüksek TensorRT burada önemli bir avantajdır.
- Video Analizi: Güvenlik veya trafik izleme amacıyla tek bir GPU birden fazla video akışını aynı anda işleme.
Ultralytics YOLO26 / YOLO11) için ideal
- Edge Computing: %43'e varan daha hızlı CPU YOLO26, pille çalışan cihazlar, akıllı kameralar ve mobil uygulamalar için mükemmeldir.
- Robotik: NMS tasarım, otonom navigasyonda gerekli olan gerçek zamanlı geri bildirim döngüleri için çok önemli olan gecikme dalgalanmasını azaltır.
- Çok modlu projeler: Nesne algılama ve poz tahminini bir arada gerektiren uygulamalar (örneğin spor analitiği) tek bir kütüphane kullanarak kod tabanını basitleştirebilir.
Sonuç
Hem PP-YOLOE+ hem de YOLOv6. YOLOv6, bilgisayar görme topluluğuna önemli katkılar sağlamaktadır. PP-YOLOE+, Paddle ekosisteminde ankrajsız doğruluğun sınırlarını zorlarken, YOLOv6.0 ise GPU endüstriyel iş yükleri için olağanüstü bir verimlilik sunmaktadır.
Ancak, bulut eğitiminden uç dağıtımına kadar çok yönlü, geleceğe dönük bir çözüm arayan geliştiriciler için Ultralytics öne çıkıyor. NMS çıkarım, bellek verimliliği yüksek eğitim ve geniş görev desteği özelliklerinin birleşimi, onu modern AI geliştirme için önerilen seçim haline getiriyor. İster akıllı şehir çözümü ister özel tarım botu geliştiriyor olun, Ultralytics sizi üretime daha hızlı ulaştıracak araçları sunar.
Daha fazla bilgi için, aşağıdaki belgeleri inceleyebilirsiniz YOLOv8 veya açık kelime haznesi algılama için özel YOLO belgelerini gözden geçirmeyi düşünün.