YOLO YOLOv5: Mimari ve Performansın Teknik Karşılaştırması
Hızla gelişen bilgisayar görme alanında, doğru nesne algılama mimarisini seçmek, doğruluk, hız ve kaynak verimliliği arasında denge sağlamak için çok önemlidir. Bu kılavuz, Alibaba Group'un Neural Architecture Search (NAS) tabanlı modeli YOLO ile YOLOv5, Ultralytics'in efsanevi ve yaygın olarak kullanılan modeli arasında kapsamlı bir teknik karşılaştırma sunar.
Yönetici Özeti
YOLO, COCO setinde daha yüksek doğruluk elde etmek için Sinirsel Mimari Arama (NAS) ve yoğun yeniden parametreleştirme gibi yenilikçi kavramları sunarken, YOLOv5 kullanılabilirlik, dağıtım hazırlığı ve ekosistem desteği açısından endüstri standardı olmaya devam ediyor.
2026 yılında en son teknolojiyi arayan geliştiriciler için, YOLO26 önerilen yükseltme yoludur. YOLOv5 kullanım kolaylığını, uçtan uca NMS tasarım ve MuSGD optimizörü gibi mimari YOLOv5 birleştirerek, hem verimlilik hem de hız açısından eski modelleri geride bırakır.
YOLO: Mimari ve Yenilikler
Alibaba Group araştırmacıları tarafından geliştirilenYOLO , otomatik mimari tasarım yoluyla hız ve doğruluk sınırlarını zorlamayaYOLO .
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 23 Kasım 2022
- Bağlantılar:Arxiv, GitHub
Temel Mimari Özellikler
- Sinir Mimarisi Arama (NAS): El ile oluşturulan omurgaların aksine,YOLO , MAE-NAS (Yardımcı Erken Durdurma Yöntemi)YOLO farklı gecikme kısıtlamalarına uygun verimli omurgaları otomatik olarak keşfeder.
- RepGFPN (Verimli Rep-parametrelendirilmiş Genelleştirilmiş FPN): Farklı ölçekler arasında bilgi akışının yolunu optimize eden yeni bir özellik füzyon boynu kullanır ve yeniden parametrelendirmeyi kullanarak özellik zenginliğini en üst düzeye çıkarırken çıkarımın hızlı olmasını sağlar.
- ZeroHead: Geleneksel ayrıştırılmış kafalara kıyasla hesaplama yükünü önemli ölçüde azaltan hafif bir algılama kafası.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki uyumsuzluk sorunlarını çözen dinamik bir etiket atama stratejisi.
Güçlü ve Zayıf Yönler
YOLO akademik karşılaştırmalardaYOLO ve genellikle eski YOLO kıyasla belirli bir parametre sayısı için daha yüksek mAP alır. Ancak, karmaşık NAS yapılarına bağımlı olması, özel donanımlar için değiştirilmesini veya ince ayar yapılmasını zorlaştırabilir. Genellikle ağır bir öğretmen modeli gerektiren "distillation-first" eğitim yöntemi de, sınırlı kaynaklara sahip kullanıcılar için eğitim sürecini karmaşıklaştırabilir.
DAMO-YOLO hakkında daha fazla bilgi edinin
YOLOv5: Endüstri Standardı
2020 Ultralytics tarafından piyasaya sürülen YOLOv5 , nesne algılama konusunda kullanıcı deneyimini YOLOv5 . Bu sadece bir model değil, eksiksiz ve üretime hazır bir çerçeveydi.
- Yazar: Glenn Jocher
- Kuruluş:Ultralytics
- Tarih: 26 Haziran 2020
- Bağlantılar:YOLOv5 , GitHub
Temel Mimari Özellikler
- CSP-Darknet Backbone: Gradyan akışını geliştirmek ve hesaplamayı azaltmak için Cross Stage Partial ağlarını kullanır; derinlik ve genişliği etkili bir şekilde dengeleyen sağlam, el yapımı bir tasarımdır.
- PANet Neck: Yol Toplama Ağı, bilgi akışını önemli ölçüde iyileştirerek, farklı backbone gelen özellikleri birleştirerek modelin nesneleri daha iyi yerelleştirmesine yardımcı olur.
- Mozaik Artırma: Dört eğitim görüntüsünü tek bir görüntüde birleştiren öncü bir veri artırma tekniği olup, modelin farklı ölçeklerde ve bağlamlarda detect etkili bir şekilde detect öğrenmesini sağlar.
- Otomatik Bağlantı: Belirli veri kümeniz için en uygun bağlantı kutularını otomatik olarak hesaplayarak, özel veriler için kurulum sürecini basitleştirir.
Güçlü ve Zayıf Yönler
YOLOv5 en büyük gücü evrenselliğidir. CoreML aracılığıyla bulut sunucularından Raspberry Pi'lere ve iPhone'lara kadar her şeyde çalışır. "Bag-of-freebies" eğitim stratejisi, karmaşık kurulumlar olmadan yüksek performans sağlar. COCO ham mAP değeriYOLO gibi yeni araştırma modellerinden daha düşük COCO da, gerçek dünyadaki güvenilirliği, aktarılabilirliği ve geniş topluluk desteği onu oldukça önemli kılmaktadır.
YOLOv5 hakkında daha fazla bilgi edinin.
Performans Kıyaslamaları
Aşağıdaki tablo, her iki modelin performansını karşılaştırmaktadır.YOLO , yoğun NAS optimizasyonu mAP YOLO , YOLOv5 hız ve dışa aktarım kolaylığı arasında YOLOv5 .
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Performans Bağlamı
YOLO benzer model boyutları mAP daha yüksek mAP YOLO , gerçek dünyadaki çıkarım hızı genellikle belirli katmanlar (RepVGG blokları gibi) için donanım desteğine bağlıdır ve bu katmanların doğru şekilde katlanması için belirli dışa aktarma adımları gerekebilir. YOLOv5 standart işlemleri neredeyse tüm çıkarım motorlarında evrensel olarak optimize edilmiştir.
Kullanım Durumu Önerileri
Bu iki mimari arasında karar verirken, dağıtım ortamınızın özel ihtiyaçlarını göz önünde bulundurun.
DAMO-YOLO için İdeal Senaryolar
- Akademik Araştırma: Amacınız NAS'ı incelemek veya bir yarışma mAP son %0,1 mAP sıkıştırmaksa,YOLO yeni mimarisi deneyler için verimli bir zemin sunar.
- Üst Düzey GPU : Bellek ve hesaplama kısıtlamalarının gevşek olduğu ve birincil ölçütün karmaşık benchmarklarda doğruluk olduğu durumlarda.
Ultralytics YOLOv5 için İdeal Senaryolar
- Kenar Dağıtımı: NVIDIA veya Raspberry Pi gibi cihazlar için, YOLOv5 basit mimarisi sorunsuz bir şekilde TensorRT ve TFLite'e sorunsuz bir şekilde aktarılabilir.
- Hızlı Prototipleme: "Sıfırdan kahramana" deneyimi, özel bir veri seti üzerinde eğitim almanızı ve sonuçları dakikalar içinde görmenizi sağlar.
- Üretim Sistemleri: İstikrar çok önemlidir. YOLOv5 , milyonlarca uygulamada savaşta test YOLOv5 , üretim hatlarında beklenmedik arızaların riskini azaltır.
Ultralytics'in Avantajı
YOLO ilginç araştırma katkılarıYOLO , Ultralytics gerçek dünya uygulamaları geliştiren geliştiriciler için belirgin avantajlar sunar.
1. Kullanım Kolaylığı ve Ekosistem
Ultralytics tüm iş akışını birleştirir. Veri kümelerini yönetebilir, bulutta modeller oluşturabilir ve ekosistemden ayrılmadan çeşitli uç noktalara dağıtım yapabilirsiniz. Kapsamlı belgeler ve aktif bir topluluk sayesinde, hiçbir zaman uzun süre bir hatayla uğraşmak zorunda kalmazsınız.
2. Algılamanın Ötesinde Çok Yönlülük
YOLO öncelikle bir nesneYOLO . Buna karşılık, Ultralytics modern yapay zeka uygulamaları için gerekli olan daha geniş bir görev yelpazesini destekler:
- Örnek Segmentasyonu: Nesnelerin piksel düzeyinde hassas maskeleme.
- Poz Tahmini: İnsanlar veya hayvanlar üzerindeki kilit noktaları izleme.
- Yönlendirilmiş Sınır Kutusu (OBB): uydu görüntülerinde gemiler gibi döndürülmüş nesneleri algılama.
- Görüntü Sınıflandırma: Görüntünün tamamının kategorize edilmesi.
3. Bellek ve Kaynak Verimliliği
Ultralytics YOLO , verimli bellek kullanımlarıyla tanınır. VRAM'ı meşgul eden transformatör ağırlıklı mimariler veya karmaşık damıtma boru hatlarının aksine, YOLOv5 YOLO26 gibi modeller genellikle tüketici sınıfı GPU'larda (RTX 3060 gibi) eğitilebilir, böylece üst düzey AI eğitimine erişimi demokratikleştirir.
4. Eğitim Verimliliği
YOLO eğitmek genellikle önceden eğitilmiş bir öğretmen modeli gerektiren karmaşık bir "damıtma" aşamasını içerir. Ultralytics , basitleştirilmiş bir "bag-of-freebies" yaklaşımı kullanır. Önceden eğitilmiş ağırlıkları yükler, veri yapılandırmanızı belirtirsiniz ve eğitim, optimize edilmiş hiperparametrelerle hemen başlar.
Geleceğe Bakış: YOLO26
2026 yılında yeni bir proje başlatıyorsanız, yukarıdakilerin hiçbiri açık bir şekilde kazanan değildir. YOLO26 verimliliğin zirvesini temsil eder.
- Uçtan Uca NMS: Non-Maximum Suppression (NMS) özelliğini kaldırarak, YOLO26 dağıtım mantığını basitleştirir ve çıkarım gecikme varyansını azaltır.
- MuSGD Optimizer: LLM eğitiminden esinlenerek geliştirilen bu optimizer, istikrarlı yakınsama ve daha hızlı eğitim süreleri sağlar.
- Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) ve optimize edilmiş blokların kaldırılmasıyla YOLO26, önceki nesillere kıyasla CPU'larda %43'e varan daha hızlı çıkarım elde ederek mobil ve IoT uygulamaları için üstün bir seçim haline gelmiştir.
YOLO26 hakkında daha fazla bilgi edinin
Kod Örneği: Ultralytics ile Çıkarım
Ultralytics basitliği, model nesilleri arasında zahmetsizce geçiş yapmanızı sağlar.
from ultralytics import YOLO
# Load the latest state-of-the-art model
model = YOLO("yolo26n.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize and save the results
for result in results:
result.show() # Display to screen
result.save(filename="output.jpg") # Save image to disk
Sonuç
YOLO YOLOv5 nesne algılama tarihinde önemli roller YOLOv5 .YOLO , Sinirsel Mimari Arama'nın potansiyeliniYOLO , YOLOv5 kullanılabilirlik ve dağıtım için standartları YOLOv5 . Ancak bu alan hızla gelişmektedir. Hız, doğruluk ve geliştirici deneyimi arasında en iyi dengeyi arayanlar için Ultralytics , modern bilgisayar görme uygulamaları için kesin seçimdir.
Daha fazla araştırma için, YOLO11 EfficientDet veya RT-DETR YOLOv8 gibi diğer mimarilerle yapılan karşılaştırmaları gözden geçirmeyi düşünün.