PP-YOLOE+ ve YOLOv7: Gerçek Zamanlı Nesne Algılama Mimarilerini Keşfetmek
Bilgisayar görüşü hızla gelişerek, geliştiricilere gerçek zamanlı nesne algılama için giderek daha güçlü araçlar sunmaktadır. Bu gelişimin iki önemli dönüm noktası, Baidu tarafından geliştirilen PP-YOLOE+ ve YOLOv7 'dir. Her iki model de hız ve doğruluk arasında denge sağlamayı amaçlamaktadır, ancak bunu temelde farklı mimari felsefeler ve eğitim metodolojileriyle başarmaktadır.
Bu kapsamlı kılavuz, bu iki mimariyi analiz ederek performans ölçütlerini, kullanım kolaylığını ve modern yapay zeka uygulamaları için uygunluğunu karşılaştırmaktadır. Ayrıca, YOLO26 gibi yeni yeniliklerin verimlilik ve dağıtım için nasıl yeni standartlar belirlediğini de inceliyoruz.
Özet: Temel Farklılıklar
| Özellik | PP-YOLOE+ | YOLOv7 |
|---|---|---|
| Mimari | Çapa içermeyen, CSPRepResStage | Çapa tabanlı, E-ELAN |
| Temel İnovasyon | Görev Uyumlaştırma Öğrenimi (TAL) | Eğitilebilir Hediye Çantası |
| Birincil Çerçeve | PaddlePaddle | PyTorch |
| En İyi Kullanım Örneği | Paddle Inference kullanan endüstriyel ortamlar | Genel amaçlı araştırma ve uygulama |
PP-YOLOE+: Gelişmiş Anchor'suz Detect
PP-YOLOE+, Baidu ekibi tarafından çeşitli donanımlarda doğruluk ve çıkarım hızını optimize etmek için geliştirilenYOLO bir evrimidir. 2022 yılında piyasaya sürülen bu ürün, algılama başlığını basitleştirmek için çapa içermeyen mekanizmaları yoğun bir şekilde kullanır.
Teknik Detaylar:
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş:Baidu
- Tarih: 2022-04-02
- Arxiv:PP-YOLOE Makalesi
- GitHub:PaddleDetection Deposu
Mimari ve Güçlü Yönler
PP-YOLOE+, Residual bağlantılarını CSP (Cross Stage Partial) ağlarıyla birleştiren bir CSPRepResStage backbone sunar. Önemli bir özelliği, eğitim sırasında sınıflandırma ve yerelleştirme görevlerini dinamik olarak hizalayan Görev Hizalama Öğrenimi (TAL) mekanizmasıdır. Bu, yüksek güvenilirlikli tespitlerin her zaman en iyi sınırlayıcı kutu örtüşmesine sahip olmadığı yaygın sorunu çözmeye yardımcı olur.
Model, PaddlePaddle tarafından yerel olarak desteklenmektedir, bu da onu Baidu'nun özel çıkarım motorlarında veya Asya endüstri pazarlarında sıklıkla kullanılan FPGA ve NPU cihazları gibi donanımlarda kullanıldığında son derece verimli hale getirmektedir.
YOLOv7: Eğitilebilir "Bag-of-Freebies"
PP-YOLOE+'dan kısa bir süre sonra piyasaya sürüldü. YOLOv7 , yazarların "bag-of-freebies" olarak adlandırdığı bir kavram olan, çıkarım maliyetini artırmadan eğitim sürecinin kendisini optimize etmeye odaklandı.
Teknik Detaylar:
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
- Tarih: 2022-07-06
- Arxiv:YOLOv7 Makalesi
- GitHub:YOLOv7 Deposu
Mimari ve Güçlü Yönler
YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) özelliğini YOLOv7 . Geleneksel ELAN'dan farklı olarak, E-ELAN, gradyan yol uzunluklarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlar. Ayrıca, optimum verimliliği korumak için derinlik ve genişliği aynı anda ayarlayan bileşik model ölçeklendirme özelliğini kullanır.
Yüksek performansına rağmen, YOLOv7 , alışılmadık nesne şekillerine sahip özel veri kümeleri için dikkatli hiperparametre ayarlaması gerektirebilen bağlantı kutularına YOLOv7 .
YOLOv7 hakkında daha fazla bilgi edinin.
Performans Kıyaslamaları
Aşağıdaki tablo, nesne algılama için standart bir karşılaştırma ölçütü olan COCO indeki modelleri karşılaştırmaktadır. PP-YOLOE+ güçlü mAP gösterirken, YOLOv7 standart GPU rekabetçi çıkarım hızları sunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Eğitim ve Ekosistem Karşılaştırması
Bir bilgisayar görme projesi için model seçerken, eğitimin kolaylığı ve çevresindeki ekosistem genellikle ham metrikler kadar önemlidir.
Çerçeve ve Kullanılabilirlik
PP-YOLOE+ PaddlePaddle gerektirir. Güçlü olmasına rağmen, PyTorch alışkın geliştiriciler için öğrenme eğrisi dik olabilir. Kurulum genellikle belirli depoların klonlanmasını içerir, örneğin: PaddleDetection ve standart global pip paketlerinden farklı olan bağımlılıkları yönetmek.
YOLOv7, PyTorch olduğu için standart Batı araştırma iş akışlarına daha doğal bir şekilde entegre olur. Ancak, orijinal depoda modern Ultralytics bulunan kesintisiz "sıfırdan kahramana" deneyimi yoktur.
Ultralytics'in Avantajı
Ultralytics , örneğin YOLOv8 ve yeni YOLO26 gibi Ultralytics modelleri, eğitimin karmaşıklığını ortadan kaldıran birleşik bir Python sunar. Bu sayede geliştiriciler, standart kodlardan ziyade verilere odaklanabilirler.
Ultralytics ile Kolaylaştırılmış Eğitim
Ultralytics ile son teknoloji bir modeli eğitmek için sadece birkaç satır kod Ultralytics ; veri artırma ve günlük kaydı işlemleri otomatik olarak gerçekleştirilir.
from ultralytics import YOLO
# Load a pretrained model (YOLO26 recommended for best performance)
model = YOLO("yolo26s.pt")
# Train on your custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Bu basitlik, dağıtım seçeneklerine de yansımakta ve ONNX ve TensorRT gibi formatlara dışa aktarımı basitleştirerek maksimum performans sağlar.
Algılamanın Geleceği: YOLO26
PP-YOLOE+ ve YOLOv7 piyasaya çıktıklarında en son teknolojiyi YOLOv7 , ancak bu alanda önemli gelişmeler kaydedildi. Ocak 2026'da piyasaya sürülen YOLO26, verimlilik ve doğruluk açısından zirveye ulaşmış bir model.
YOLO26'nın Önemli Yenilikleri:
- Uçtan Uca NMS: Non-Maximum Suppression (NMS) son işlem YOLOv7 farklı YOLOv7 YOLO26 doğal olarak uçtan uca çalışır. Bu, kalabalık NMS neden olduğu gecikme değişkenliğini ortadan kaldırarak, akıllı şehir uygulamaları ve trafik izleme için ideal hale getirir.
- MuSGD Optimizer: LLM eğitim tekniklerinden esinlenen bu optimizer, SGD Muon'u birleştirerek eski mimarilerde bulunmayan istikrarlı bir eğitim dinamiği sağlar.
- Kenar Optimizasyonu: Dağıtım Odak Kaybını (DFL) ortadan kaldırarak, YOLO26 CPU %43'e varan hız artışı sağlar ve PP-YOLOE+'nın daha ağır hesaplama gereksinimlerine kıyasla kenar cihazları için çok daha üstün bir performans sunar.
- ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, tarım ve hava görüntüleme gibi alanlar için çok önemli olan küçük nesnelerin algılanmasını iyileştirir.
YOLO26 hakkında daha fazla bilgi edinin
Gerçek Dünya Uygulamaları
Model seçimi genellikle belirli uygulamaların başarısını belirler.
PP-YOLOE+ Kullanım Alanları
- Asya'da Endüstriyel Denetim: Asya'daki üretim merkezlerinde PaddlePaddle güçlü PaddlePaddle sayesinde, PP-YOLOE+ genellikle Baidu'nun yığını için donanımın önceden yapılandırıldığı montaj hatlarında kusurları tespit etmek için kullanılır.
- Statik Görüntü Analizi: Yüksek mAP değeri, gerçek zamanlı gecikmenin mutlak hassasiyetten daha az önemli olduğu çevrimdışı işlemler için uygun olmasını mAP .
YOLOv7 Örnekleri
- Genel Amaçlı Araştırma: PyTorch nedeniyle akademik makalelerde yaygın olarak temel referans olarak kullanılır.
- GPU Sistemler: Video analizi gibi görevlerde sunucu sınıfı GPU'larda iyi performans gösterir.
Ultralytics Kullanım Örnekleri (YOLO26)
- Edge AI & IoT: Ultralytics düşük bellek ayak izi ve yüksek CPU , onları Raspberry Pi ve mobil uygulamalar için mükemmel hale getirir.
- Çok Modlu Görevler: Basit kutuların ötesinde, Ultralytics Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) Ultralytics robotik kavrama veya belge analizi gibi karmaşık uygulamalara olanak tanır.
- Hızlı Prototipleme: Ultralytics , ekiplerin veri kümesi açıklamalarından dağıtılmış modele dakikalar içinde geçmelerini sağlayarak pazara sunma süresini önemli ölçüde kısaltır.
Sonuç
Hem PP-YOLOE+ hem de YOLOv7 , bilgisayar görme alanına önemli katkılarda YOLOv7 . PP-YOLOE+, ankarsız algılamanın sınırlarını zorlarken, YOLOv7 ise ankarsız mimarilerin verimliliğini YOLOv7
Ancak, hız, doğruluk ve kullanım kolaylığı gibi her iki dünyanın en iyi özelliklerini bir araya getiren, geleceğe dönük bir çözüm arayan geliştiriciler içinYOLO26 önerilen seçimdir. NMS tasarımı, sağlam dışa aktarma yetenekleri ve Ultralytics sorunsuz entegrasyonu ile modern AI zorlukları için en çok yönlü araç setini sunar.
Diğer yüksek performanslı seçenekleri keşfetmek için, YOLOv9 veya YOLOv10belgelerine göz atın.