YOLOv5 ve PP-YOLOE+: Modern Nesne Algılamaya Teknik Bir Bakış
Doğru sinir ağı mimarisini seçmek, her modern bilgisayarlı görü projesi için temeldir. Geliştiriciler ve araştırmacılar gerçek zamanlı nesne algılama için modelleri değerlendirirken, karar genellikle doğruluk, çıkarım hızı ve dağıtım kolaylığını dengelemeye dayanır. Bu teknik karşılaştırma, YOLOv5 ve PP-YOLOE+ modellerini inceleyerek mimarilerini, performans metriklerini ve eğitim metodolojilerini keşfeder ve uygulamanız için en uygun çözümü seçmenize yardımcı olur.
Mimarileri Anlamak
Her iki model de görü yapay zekası dünyasında önemli etkiler yarattı, ancak nesne algılama zorluklarına farklı yapısal metodolojiler ve çerçeve bağımlılıkları ile yaklaşıyorlar.
Ultralytics YOLOv5: Sektör Standardı
2020 yılının ortalarında piyasaya sürülen Ultralytics YOLOv5, en son teknoloji ürünü görü modellerinin erişilebilirliğinde devrim yarattı. YOLO ailesindeki ilk yerel PyTorch uygulaması olarak, dünya genelindeki Python geliştiricileri ve makine öğrenimi mühendisleri için giriş engelini önemli ölçüde düşürdü.
YOLOv5 Detayları:
- Yazarlar: Glenn Jocher
- Organizasyon: Ultralytics
- Tarih: 2020-06-26
- GitHub: ultralytics/yolov5
- Dokümantasyon: YOLOv5 Dokümantasyonu
YOLOv5, hafif bir parametre sayısını korurken zengin özellik temsillerini verimli bir şekilde yakalayan değiştirilmiş bir CSPDarknet omurgası kullanır. Eğitim başlamadan önce özel veri kümeleri için en uygun çapa boyutlarını otomatik olarak hesaplayan otomatik öğrenen çapa kutularını tanıttı. Ayrıca, mozaik veri artırma entegrasyonu, modelin daha küçük nesneleri algılama ve karmaşık uzamsal bağlamlarda genelleme yapma yeteneğini önemli ölçüde geliştirir.
YOLOv5'in en büyük güçlerinden biri inanılmaz çok yönlülüğüdür. Standart nesne algılayıcıların aksine, YOLOv5 ailesi görüntü sınıflandırma, örnek bölümleme ve sınırlayıcı kutu algılamayı birleşik bir API içinde sorunsuz bir şekilde destekler. Yüksek derecede optimize edilmiş mimarisi, ağır transformer tabanlı ağlara kıyasla eğitim ve çıkarım sırasında önemli ölçüde daha düşük bellek kullanımına da dönüşür.
YOLOv5 hakkında daha fazla bilgi edin
PP-YOLOE+: PaddlePaddle Rakibi
Yaklaşık iki yıl sonra tanıtılan PP-YOLOE+, önceki PP-YOLO sürümlerinin temeli üzerine inşa edilmiştir. Baidu'nun derin öğrenme çerçevesinin yeteneklerini sergilemek için geliştirilen model, ortalama Hassasiyeti (mAP) artırmak için çeşitli mimari iyileştirmeler sunar.
PP-YOLOE+ Detayları:
- Yazarlar: PaddlePaddle Yazarları
- Organizasyon: Baidu
- Tarih: 02.04.2022
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
- Dokümanlar: PP-YOLOE+ README
PP-YOLOE+, çapasız bir paradigmaya dayanır ve bir CSPRepResNet omurgası kullanır. Hassasiyeti artırmak için güçlü bir Görev Hizalama Öğrenme tekniği ve Verimli Görev hizalı Başlık içerir. PP-YOLOE+ etkileyici doğruluk puanları elde etse de, birincil zayıflığı PaddlePaddle çerçevesine olan katı bağımlılığıdır. Bu durum, halihazırda PyTorch veya TensorFlow ortamlarına derinlemesine yatırım yapmış araştırma ekipleri ve işletmeler için genellikle dik bir öğrenme eğrisi ve ekosistem sürtünmesi oluşturur.
PP-YOLOE+ hakkında daha fazla bilgi edin
Performans ve Kıyaslamalar
Bu modelleri üretim için değerlendirirken, hassasiyet, çıkarım hızı ve parametre ayak izi arasındaki ödünleşimleri anlamak çok önemlidir. Aşağıdaki tablo, farklı boyut varyantları genelindeki temel performans metriklerini özetlemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
PP-YOLOE+ yüksek doğruluk sınırlarına ulaşsa da, YOLOv5 sürekli olarak üstün parametre verimliliği ve kısıtlı donanımda daha hızlı çıkarım sergiler. Belleğin az olduğu uç dağıtımlar için YOLOv5n, rakipsiz hız ve son derece küçük bir ayak izi sunar.
Ultralytics modelleri, eğitim verimliliği için özel olarak tasarlanmıştır. RT-DETR gibi ağır görü transformer'larına kıyasla, YOLOv5 önemli ölçüde daha az CUDA belleği kullanır ve bu da daha büyük toplu boyutlarda veya tüketici sınıfı donanımda eğitim yapmanı sağlar.
Ultralytics Avantajı: Ekosistem ve Kullanım Kolaylığı
Bir makine öğrenimi mimarisinin gerçek değeri saf sayıların ötesine uzanır; tüm geliştirici deneyimini kapsar. Ultralytics Platform ve buna karşılık gelen açık kaynaklı araçlar, geliştirme döngülerini önemli ölçüde hızlandıran, oldukça rafine ve iyi bakımlı bir ekosistem sağlar.
- Kullanım Kolaylığı: Ultralytics, karmaşık ortak kodları soyutlar. Modelleri sezgisel bir Python API veya CLI aracılığıyla eğitebilir, doğrulayabilir ve test edebilirsin.
- Dağıtım Esnekliği: Modelleri dışa aktarmak inanılmaz derecede basittir. Tek bir komutla, eğitilmiş YOLOv5 ağırlıklarını ONNX, TensorRT veya OpenVINO gibi formatlara dönüştürebilir, uç ve bulut ortamlarında geniş uyumluluk sağlayabilirsin.
- Aktif Topluluk: Canlı topluluk, sık güncellemeler, kapsamlı dokümantasyon ve yaygın bilgisayarlı görü zorluklarına yönelik sağlam çözümler garanti eder.
Buna karşılık, PP-YOLOE+ PaddleDetection'a özgü karmaşık yapılandırma dosyalarına ağır bir şekilde güvenir, bu da hızlı prototiplemeyi yavaşlatabilir ve modern MLOps boru hatlarına entegrasyonu karmaşıklaştırabilir.
Pratik Uygulamalar ve Kod Örnekleri
Ultralytics ile başlamak oldukça basittir. İşte önceden eğitilmiş bir YOLOv5 modelini nasıl yükleyeceğine, özel bir veri kümesi üzerinde eğiteceğine ve sonuçları nasıl dışa aktaracağına dair eksiksiz, çalıştırılabilir bir örnek:
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")
# Export the optimized model to ONNX format
path = model.export(format="onnx")Kullanım Durumları ve Öneriler
YOLOv5 ve PP-YOLOE+ arasında seçim yapmak, projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Ne Zaman YOLOv5 Seçilmeli
YOLOv5 şunlar için güçlü bir seçimdir:
- Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun istikrar geçmişine, kapsamlı dokümantasyonuna ve devasa topluluk desteğine değer verilen mevcut dağıtımlar.
- Kaynak Kısıtlı Eğitim: YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantajlı olduğu, sınırlı GPU kaynağına sahip ortamlar.
- Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.
PP-YOLOE+ Ne Zaman Seçilmeli
PP-YOLOE+ şunlar için önerilir:
- PaddlePaddle Ekosistemi Entegrasyonu: Baidu'nun PaddlePaddle çerçevesi ve araçları üzerine kurulu mevcut altyapıya sahip kuruluşlar.
- Paddle Lite Uç Dağıtımı: Paddle Lite veya Paddle çıkarım motoru için özel olarak optimize edilmiş çıkarım çekirdeklerine sahip donanımlara dağıtım yaparken.
- Yüksek Doğruluklu Sunucu Tarafı Algılama: Çerçeve bağımlılığının bir sorun olmadığı güçlü GPU sunucularında maksimum algılama doğruluğuna öncelik veren senaryolar.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Dikkate Alınması Gereken Alternatif Son Teknoloji Modeller
YOLOv5 sağlam ve kanıtlanmış bir standart olsa da, bilgisayarlı görü alanı hızla ilerlemektedir. Yeni projelere başlayan ekipler için daha yeni mimarilerimizi keşfetmelerini şiddetle tavsiye ederiz.
Ultralytics YOLO26
Ocak 2026'da piyasaya sürülen YOLO26, araştırmamızın mutlak zirvesini temsil ediyor. Hem doğruluk hem de hızda büyük iyileştirmeler sağlıyor. Temel yenilikler şunları içerir:
- Uçtan Uca NMS-İçermeyen Tasarım: YOLOv10 kavramlarının üzerine inşa edilen YOLO26, Non-Maximum Suppression (NMS) son işlemesini doğal olarak ortadan kaldırarak gecikmeyi azaltır ve dağıtım mantığını basitleştirir.
- DFL Kaldırma: Distribution Focal Loss'u kaldırarak, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder ve bu da onu düşük güçlü uç cihazlar için inanılmaz derecede güçlü kılar.
- MuSGD Optimize Edici: Gelişmiş LLM eğitim tekniklerinden esinlenen bu SGD ve Muon hibriti, son derece istikrarlı eğitim çalışmaları ve daha hızlı yakınsama sağlar.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone görüntüleri ve akıllı tarım için kritik öneme sahip küçük nesne tanıma konusunda önemli iyileştirmeler sağlar.
Ek olarak, mükemmel performans sunan ve eski sistemler ile YOLO26'nın en uç yetenekleri arasında oldukça güvenilir bir köprü görevi gören YOLO11 modelini düşünebilirsin.
Gerçek Dünya Kullanım Durumları
YOLOv5 ile PP-YOLOE+ arasındaki seçim, sonuçta dağıtım ortamına ve proje kısıtlamalarına bağlıdır.
İdeal YOLOv5 Uygulamaları: YOLOv5'in minimum kaynak gereksinimleri ve inanılmaz kullanım kolaylığı, onu uç yapay zekası için birincil seçenek haline getirir. Gerçek zamanlı robotik, mobil uygulama entegrasyonu ve çok kameralı trafik izleme sistemleri gibi sınırlı donanımda yüksek kare hızları gerektiren uygulamalarda mükemmeldir. Aynı çerçeve içinde poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) görevlerini aynı anda idare edebilme yeteneği, onu oldukça uyarlanabilir kılar.
İdeal PP-YOLOE+ Uygulamaları: PP-YOLOE+, gerçek zamanlı işleme kısıtlamalarına göre statik görüntülerde mutlak maksimum doğruluğun önceliklendirildiği senaryolar için en uygun olanıdır. Özellikle Baidu ve PaddlePaddle ekosistemine ağır bir şekilde yatırım yapmış, önceden kurulmuş teknik yığınlara sahip Asya üretim sektörlerinde endüstriyel denetim süreçlerinde niş bir kullanım alanı bulur.
Özetle, PP-YOLOE+ güçlü hassasiyet ölçütleri sunarken, Ultralytics YOLO modelleri, başarılı bilgisayarlı görü projelerini kavramdan üretime taşıyan performans dengesi, sorunsuz dağıtım ve geliştirici dostu tasarımın rakipsiz bir kombinasyonunu sağlar.