YOLO YOLOv5: Mimari ve Performansın Teknik Karşılaştırması

Hızla gelişen bilgisayar görme alanında, doğru nesne algılama mimarisini seçmek, doğruluk, hız ve kaynak verimliliği arasında denge sağlamak için çok önemlidir. Bu kılavuz, Alibaba Group'un Neural Architecture Search (NAS) tabanlı modeli YOLO ile YOLOv5, Ultralytics'in efsanevi ve yaygın olarak kullanılan modeli arasında kapsamlı bir teknik karşılaştırma sunar.

Yönetici Özeti

YOLO, COCO setinde daha yüksek doğruluk elde etmek için Sinirsel Mimari Arama (NAS) ve yoğun yeniden parametreleştirme gibi yenilikçi kavramları sunarken, YOLOv5 kullanılabilirlik, dağıtım hazırlığı ve ekosistem desteği açısından endüstri standardı olmaya devam ediyor.

2026 yılında en son teknolojiyi arayan geliştiriciler için, YOLO26 önerilen yükseltme yoludur. YOLOv5 kullanım kolaylığını, uçtan uca NMS tasarım ve MuSGD optimizörü gibi mimari YOLOv5 birleştirerek, hem verimlilik hem de hız açısından eski modelleri geride bırakır.

YOLO: Mimari ve Yenilikler

Alibaba Group araştırmacıları tarafından geliştirilenYOLO , otomatik mimari tasarım yoluyla hız ve doğruluk sınırlarını zorlamayaYOLO .

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 23 Kasım 2022
Bağlantılar:Arxiv, GitHub

Temel Mimari Özellikler

Sinir Mimarisi Arama (NAS): El ile oluşturulan omurgaların aksine,YOLO , MAE-NAS (Yardımcı Erken Durdurma Yöntemi)YOLO farklı gecikme kısıtlamalarına uygun verimli omurgaları otomatik olarak keşfeder.
RepGFPN (Verimli Rep-parametrelendirilmiş Genelleştirilmiş FPN): Farklı ölçekler arasında bilgi akışının yolunu optimize eden yeni bir özellik füzyon boynu kullanır ve yeniden parametrelendirmeyi kullanarak özellik zenginliğini en üst düzeye çıkarırken çıkarımın hızlı olmasını sağlar.
ZeroHead: Geleneksel ayrıştırılmış kafalara kıyasla hesaplama yükünü önemli ölçüde azaltan hafif bir algılama kafası.
AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki uyumsuzluk sorunlarını çözen dinamik bir etiket atama stratejisi.

Güçlü ve Zayıf Yönler

YOLO akademik karşılaştırmalardaYOLO ve genellikle eski YOLO kıyasla belirli bir parametre sayısı için daha yüksek mAP alır. Ancak, karmaşık NAS yapılarına bağımlı olması, özel donanımlar için değiştirilmesini veya ince ayar yapılmasını zorlaştırabilir. Genellikle ağır bir öğretmen modeli gerektiren "distillation-first" eğitim yöntemi de, sınırlı kaynaklara sahip kullanıcılar için eğitim sürecini karmaşıklaştırabilir.

DAMO-YOLO hakkında daha fazla bilgi edinin

YOLOv5: Endüstri Standardı

2020 Ultralytics tarafından piyasaya sürülen YOLOv5 , nesne algılama konusunda kullanıcı deneyimini YOLOv5 . Bu sadece bir model değil, eksiksiz ve üretime hazır bir çerçeveydi.

Yazar: Glenn Jocher
Kuruluş:Ultralytics
Tarih: 26 Haziran 2020
Bağlantılar:YOLOv5 , GitHub

Temel Mimari Özellikler

CSP-Darknet Backbone: Gradyan akışını geliştirmek ve hesaplamayı azaltmak için Cross Stage Partial ağlarını kullanır; derinlik ve genişliği etkili bir şekilde dengeleyen sağlam, el yapımı bir tasarımdır.
PANet Neck: Yol Toplama Ağı, bilgi akışını önemli ölçüde iyileştirerek, farklı backbone gelen özellikleri birleştirerek modelin nesneleri daha iyi yerelleştirmesine yardımcı olur.
Mozaik Artırma: Dört eğitim görüntüsünü tek bir görüntüde birleştiren öncü bir veri artırma tekniği olup, modelin farklı ölçeklerde ve bağlamlarda detect etkili bir şekilde detect öğrenmesini sağlar.
Otomatik Bağlantı: Belirli veri kümeniz için en uygun bağlantı kutularını otomatik olarak hesaplayarak, özel veriler için kurulum sürecini basitleştirir.

Güçlü ve Zayıf Yönler

YOLOv5 en büyük gücü evrenselliğidir. CoreML aracılığıyla bulut sunucularından Raspberry Pi'lere ve iPhone'lara kadar her şeyde çalışır. "Bag-of-freebies" eğitim stratejisi, karmaşık kurulumlar olmadan yüksek performans sağlar. COCO ham mAP değeriYOLO gibi yeni araştırma modellerinden daha düşük COCO da, gerçek dünyadaki güvenilirliği, aktarılabilirliği ve geniş topluluk desteği onu oldukça önemli kılmaktadır.

YOLOv5 hakkında daha fazla bilgi edinin.

Performans Kıyaslamaları

Aşağıdaki tablo, her iki modelin performansını karşılaştırmaktadır.YOLO , yoğun NAS optimizasyonu mAP YOLO , YOLOv5 hız ve dışa aktarım kolaylığı arasında YOLOv5 .

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Performans Bağlamı

YOLO benzer model boyutları mAP daha yüksek mAP YOLO , gerçek dünyadaki çıkarım hızı genellikle belirli katmanlar (RepVGG blokları gibi) için donanım desteğine bağlıdır ve bu katmanların doğru şekilde katlanması için belirli dışa aktarma adımları gerekebilir. YOLOv5 standart işlemleri neredeyse tüm çıkarım motorlarında evrensel olarak optimize edilmiştir.

Kullanım Durumu Önerileri

Bu iki mimari arasında karar verirken, dağıtım ortamınızın özel ihtiyaçlarını göz önünde bulundurun.

DAMO-YOLO için İdeal Senaryolar

Akademik Araştırma: Amacınız NAS'ı incelemek veya bir yarışma mAP son %0,1 mAP sıkıştırmaksa,YOLO yeni mimarisi deneyler için verimli bir zemin sunar.
Üst Düzey GPU : Bellek ve hesaplama kısıtlamalarının gevşek olduğu ve birincil ölçütün karmaşık benchmarklarda doğruluk olduğu durumlarda.

Ultralytics YOLOv5 için İdeal Senaryolar

Kenar Dağıtımı: NVIDIA veya Raspberry Pi gibi cihazlar için, YOLOv5 basit mimarisi sorunsuz bir şekilde TensorRT ve TFLite'e sorunsuz bir şekilde aktarılabilir.
Hızlı Prototipleme: "Sıfırdan kahramana" deneyimi, özel bir veri seti üzerinde eğitim almanızı ve sonuçları dakikalar içinde görmenizi sağlar.
Üretim Sistemleri: İstikrar çok önemlidir. YOLOv5 , milyonlarca uygulamada savaşta test YOLOv5 , üretim hatlarında beklenmedik arızaların riskini azaltır.

Ultralytics'in Avantajı

YOLO ilginç araştırma katkılarıYOLO , Ultralytics gerçek dünya uygulamaları geliştiren geliştiriciler için belirgin avantajlar sunar.

1. Kullanım Kolaylığı ve Ekosistem

Ultralytics tüm iş akışını birleştirir. Veri kümelerini yönetebilir, bulutta modeller oluşturabilir ve ekosistemden ayrılmadan çeşitli uç noktalara dağıtım yapabilirsiniz. Kapsamlı belgeler ve aktif bir topluluk sayesinde, hiçbir zaman uzun süre bir hatayla uğraşmak zorunda kalmazsınız.

2. Algılamanın Ötesinde Çok Yönlülük

YOLO öncelikle bir nesneYOLO . Buna karşılık, Ultralytics modern yapay zeka uygulamaları için gerekli olan daha geniş bir görev yelpazesini destekler:

Örnek Segmentasyonu: Nesnelerin piksel düzeyinde hassas maskeleme.
Poz Tahmini: İnsanlar veya hayvanlar üzerindeki kilit noktaları izleme.
Yönlendirilmiş Sınır Kutusu (OBB): uydu görüntülerinde gemiler gibi döndürülmüş nesneleri algılama.
Görüntü Sınıflandırma: Görüntünün tamamının kategorize edilmesi.

3. Bellek ve Kaynak Verimliliği

Ultralytics YOLO , verimli bellek kullanımlarıyla tanınır. VRAM'ı meşgul eden transformatör ağırlıklı mimariler veya karmaşık damıtma boru hatlarının aksine, YOLOv5 YOLO26 gibi modeller genellikle tüketici sınıfı GPU'larda (RTX 3060 gibi) eğitilebilir, böylece üst düzey AI eğitimine erişimi demokratikleştirir.

4. Eğitim Verimliliği

YOLO eğitmek genellikle önceden eğitilmiş bir öğretmen modeli gerektiren karmaşık bir "damıtma" aşamasını içerir. Ultralytics , basitleştirilmiş bir "bag-of-freebies" yaklaşımı kullanır. Önceden eğitilmiş ağırlıkları yükler, veri yapılandırmanızı belirtirsiniz ve eğitim, optimize edilmiş hiperparametrelerle hemen başlar.

Geleceğe Bakış: YOLO26

2026 yılında yeni bir proje başlatıyorsanız, yukarıdakilerin hiçbiri açık bir şekilde kazanan değildir. YOLO26 verimliliğin zirvesini temsil eder.

Uçtan Uca NMS: Non-Maximum Suppression (NMS) özelliğini kaldırarak, YOLO26 dağıtım mantığını basitleştirir ve çıkarım gecikme varyansını azaltır.
MuSGD Optimizer: LLM eğitiminden esinlenerek geliştirilen bu optimizer, istikrarlı yakınsama ve daha hızlı eğitim süreleri sağlar.
Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) ve optimize edilmiş blokların kaldırılmasıyla YOLO26, önceki nesillere kıyasla CPU'larda %43'e varan daha hızlı çıkarım elde ederek mobil ve IoT uygulamaları için üstün bir seçim haline gelmiştir.

YOLO26 hakkında daha fazla bilgi edinin

Kod Örneği: Ultralytics ile Çıkarım

Ultralytics basitliği, model nesilleri arasında zahmetsizce geçiş yapmanızı sağlar.

from ultralytics import YOLO

# Load the latest state-of-the-art model
model = YOLO("yolo26n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize and save the results
for result in results:
    result.show()  # Display to screen
    result.save(filename="output.jpg")  # Save image to disk

Sonuç

YOLO YOLOv5 nesne algılama tarihinde önemli roller YOLOv5 .YOLO , Sinirsel Mimari Arama'nın potansiyeliniYOLO , YOLOv5 kullanılabilirlik ve dağıtım için standartları YOLOv5 . Ancak bu alan hızla gelişmektedir. Hız, doğruluk ve geliştirici deneyimi arasında en iyi dengeyi arayanlar için Ultralytics , modern bilgisayar görme uygulamaları için kesin seçimdir.

Daha fazla araştırma için, YOLO11 EfficientDet veya RT-DETR YOLOv8 gibi diğer mimarilerle yapılan karşılaştırmaları gözden geçirmeyi düşünün.

YOLO YOLOv5: Mimari ve Performansın Teknik Karşılaştırması

Yönetici Özeti

YOLO: Mimari ve Yenilikler

Temel Mimari Özellikler

Güçlü ve Zayıf Yönler

YOLOv5: Endüstri Standardı

Temel Mimari Özellikler

Güçlü ve Zayıf Yönler

Performans Kıyaslamaları

Kullanım Durumu Önerileri

DAMO-YOLO için İdeal Senaryolar

Ultralytics YOLOv5 için İdeal Senaryolar

Ultralytics'in Avantajı

1. Kullanım Kolaylığı ve Ekosistem

2. Algılamanın Ötesinde Çok Yönlülük

3. Bellek ve Kaynak Verimliliği

4. Eğitim Verimliliği

Geleceğe Bakış: YOLO26

Kod Örneği: Ultralytics ile Çıkarım

Sonuç

Yorumlar