İçeriğe geç

YOLOv5 YOLOv7: Gerçek Zamanlı Nesne Algılayıcılarının Evrimi

Doğru nesne algılama mimarisini seçmek, doğruluk, çıkarım hızı ve dağıtım kolaylığı arasında denge kurmayı gerektirir. Bu kılavuz, aşağıdakiler arasında ayrıntılı bir teknik karşılaştırma sunar Ultralytics YOLOv5 ve YOLOv7arasında ayrıntılı bir teknik karşılaştırma sunar. Bilgisayar görme projeleriniz için bilinçli bir karar vermenize yardımcı olmak amacıyla, bu modellerin mimari farklılıklarını, performans karşılaştırmalarını ve ideal kullanım örneklerini analiz ediyoruz.

Yönetici Özeti

Her iki model de yetenekli olsa da, YOLOv5 kullanılabilirlik, dağıtım çok yönlülüğü ve topluluk desteği açısından sektör standardı olmaya devam etmektedir. Olgun ekosistemi ve Ultralytics ile sorunsuz entegrasyonu, onu üretim ortamları için mükemmel bir seçim haline getirmektedir. YOLOv7, GPU daha yüksek tepe doğruluğu için E-ELAN gibi mimari yenilikler getirmiştir, ancak Ultralytics bulunan kapsamlı çoklu görev desteği ve modern araçlardan yoksundur.

2026 yılında yeni projeler başlatan geliştiricilere, aşağıdakileri değerlendirmenizi şiddetle tavsiye ederiz YOLO26'yi değerlendirmenizi şiddetle tavsiye ederizNMS

Ultralytics YOLOv5: Üretim Standardı

YOLOv5 sadece ham metriklerle değil, geliştirici deneyimini önceliklendirerek de bu alanda devrim yarattı. Bu, PyTorch'ta yerel olarak uygulanan ilk YOLO . PyTorchuygulanan ilk YOLO modeliydi ve bu sayede geniş bir araştırmacı ve mühendis topluluğunun erişimine açıldı. "Eğitmesi kolay, uygulaması kolay" felsefesi, onu otonom araçlardan endüstriyel denetime kadar gerçek dünya uygulamaları için vazgeçilmez bir çözüm haline getirdi.

Yazar: Glenn Jocher
Kuruluş:Ultralytics
Tarih: 2020-06-26
GitHub:ultralytics/yolov5
Belgeler:YOLOv5 Belgeleri

YOLOv5 hakkında daha fazla bilgi edinin.

Mimari ve Tasarım

YOLOv5 , bilgileri korurken hesaplamayı azaltmak için Focus katmanı (daha sonra 6x6 konvolüsyon ile değiştirildi) backbone CSP-Darknet53 backbone YOLOv5 . Özellik birleştirme ve çok ölçekli tahmin için Path Aggregation Network (PANet) boynu kullanır. Temel mimari özellikleri şunlardır:

  • Mozaik Veri Artırma: Dört görüntüyü tek bir görüntüde birleştiren bir eğitim tekniği olup, modelin detect nesneleri detect yeteneğini geliştirir ve büyük mini gruplara olan ihtiyacı azaltır.
  • Otomatik Öğrenme Sınırlayıcı Kutu Bağlantıları: Model, eğitim sırasında bağlantı kutularını özel veri kümelerinin belirli geometrisine otomatik olarak uyarlar.
  • SiLU Aktivasyonu: Daha yumuşak gradyan yayılımı için Sigmoid Doğrusal Birim (SiLU) aktivasyon fonksiyonunun kullanılması.

Temel Güçlü Yönler

  • Kullanım Kolaylığı: Basitleştirilmiş API ve kapsamlı dokümantasyon, geliştiricilerin sadece birkaç satır kodla özel bir model eğitmelerine olanak tanır.
  • Dağıtım Çok Yönlülüğü: Yerleşik dışa aktarım desteği ONNX, TensorRT, CoreML, TFLite ve OpenVINO için yerleşik dışa aktarma desteği, uç ve bulut hedeflerinde sorunsuz dağıtım OpenVINO
  • Çoklu Görev Yetenekleri: Algılamanın ötesinde, YOLOv5 örnek segmentasyonu ve görüntü sınıflandırmasını YOLOv5 çeşitli görme görevleri için kapsamlı bir araç seti sunar.

YOLOv7: GPU Artırma

YOLOv7 , GPU hız ve doğruluk sınırlarını zorlamak için tasarlanmıştır. Tahmin maliyetini artırmadan doğruluğu artıran çeşitli "bag-of-freebies" stratejileri sunarak, yüksek performanslı bilgi işlem senaryoları için güçlü bir rakip haline gelmiştir.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7
Belgeler:YOLOv7

YOLOv7 hakkında daha fazla bilgi edinin.

Mimari ve İnovasyon

YOLOv7 , verimli mimari tasarımı ve model ölçeklendirmeye YOLOv7 . En önemli yeniliği, modelin en kısa ve en uzun gradyan yollarını kontrol ederek daha çeşitli özellikleri öğrenmesini sağlayan Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN)dır.

  • Model Ölçeklendirme: YOLOv7 , birleştirme tabanlı modeller için derinlik ve genişliği aynı anda değiştiren bileşik bir ölçeklendirme yöntemi YOLOv7 , farklı donanım kısıtlamaları için mimariyi optimize eder.
  • Yardımcı Başlık Kaba-İnce: Öğrenme sürecini yönlendiren bir yardımcı başlık kullanır, bu başlık daha sonra çıkarım için ana başlığa yeniden parametrelendirilir ve böylece dağıtımda hız kaybı yaşanmaz.
  • Planlı Yeniden Parametreleştirme: Mimari, hız ve doğruluğu dengelemek için stratejik olarak yeniden parametreleştirilmiş konvolüsyonlar (RepConv) kullanır ve kalıntı öğrenmeyi bozan kimlik bağlantılarını önler.

Performans Karşılaştırması

Aşağıdaki tablo, COCO YOLOv5 YOLOv7 performansını karşılaştırmaktadır. YOLOv7 , GPU ham mAP güçlü yönlerini YOLOv7 , YOLOv5 özellikle CPU rekabetçi bir hız YOLOv5 ve daha küçük modeller için önemli ölçüde daha düşük parametre sayıları YOLOv5 .

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Sonuçların Analizi

  • Verimlilik: YOLOv5n (Nano) son derece hafiftir, bu da her megabayt belleğin önemli olduğu, yüksek kısıtlamalara sahip uç cihazlar için mükemmel bir seçimdir.
  • Doğruluk: YOLOv7x daha yüksek bir mAP (53,1%) elde ederek, yüksek kaliteli GPU görevleri için E-ELAN mimarisinin avantajlarını ortaya koymaktadır.
  • Dağıtım: YOLOv5 için CPU ONNX iyi belgelenmiş ve optimize YOLOv5 ,GPU için güvenilir performans sağlar.

Kenar için seçim yapmak

Raspberry Pi veya cep telefonları gibi uç cihazlar için, YOLOv5n veya YOLOv5s, daha düşük bellek ayak izi ve kanıtlanmış TFLite uyumluluğu nedeniyle genellikle daha üstün seçimlerdir.

Eğitim ve Ekosistem

En önemli farklardan biri, modelleri çevreleyen ekosistemdir. Ultralytics YOLO , tüm makine öğrenimi operasyonları (MLOps) yaşam döngüsünü basitleştiren, sürekli olarak bakım yapılan bir platformdan yararlanır.

Ultralytics Ekosistem Avantajı

  • Entegre Platform: Ultralytics , kullanıcıların veri kümelerini yönetmelerine, eğitim çalıştırmalarını görselleştirmelerine ve modelleri bir web arayüzünden sorunsuz bir şekilde dağıtmalarına olanak tanır.
  • Eğitim Verimliliği: YOLOv5 , verimli veri yükleyiciler ve akıllı önbellekleme YOLOv5 , eski mimarilere kıyasla özel veri kümelerinde eğitim süresini önemli ölçüde azaltır.
  • Topluluk Desteği: GitHub ve Discord'da binlerce katkıcı ve aktif tartışma sayesinde, Ultralytics sınır durumlarına çözüm bulmak daha hızlıdır.

Kod Örneği: Ultralytics ile Eğitim

Ultralytics ile YOLO eğitmek, tüm sürümlerde Ultralytics . Model adını değiştirerek YOLOv5, YOLO11 ve önerilen YOLO26 arasında geçiş yapabilirsiniz.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model
model = YOLO("yolov5s.pt")

# Train the model on a custom dataset
# The API handles data downloading and configuration automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a new image
predictions = model("path/to/image.jpg")

Gelecek: Neden YOLO26'ya geçmelisiniz?

YOLOv5 YOLOv7 karşılaştırmak, eski sistemleri anlamak açısından değerli YOLOv7 , teknoloji önemli ölçüde ilerlemiştir. Ocak 2026'da piyasaya sürülen Ultralytics , nesne algılamada bir paradigma değişikliğini temsil etmektedir.

YOLO26 hakkında daha fazla bilgi edinin

  • Yerel olarak uçtan uca: Non-Maximum Suppression (NMS) son işlem gerektiren YOLOv5 YOLOv7 farklı olarak, YOLO26 yerel olarak NMS gerektirmez. Bu, dağıtım süreçlerini basitleştirir ve gecikme değişkenliğini azaltır.
  • MuSGD Optimizer: LLM eğitimindeki yeniliklerden yararlanan MuSGD optimizer, çeşitli veri kümelerinde daha istikrarlı bir yakınsama ve sağlam performans sağlar.
  • Geliştirilmiş Hız: YOLO26, önceki nesillere kıyasla %43'e kadar daha hızlı CPU sunarak modern uç AI uygulamaları için üstün bir seçimdir.
  • Çok yönlülük: Daha iyi küçük nesne algılama için ProgLoss ve STAL gibi özel kayıp fonksiyonlarıyla Oryantasyonlu Sınırlayıcı Kutu (OBB), Poz Tahmini ve Segmentasyonu doğal olarak destekler.

Sonuç

Hem YOLOv5 YOLOv7 , bilgisayar görme tarihindeki yerlerini YOLOv7 . YOLOv7 , belirli GPU mAP en üst düzeye çıkarmak için güçlü bir araştırma aracıdır. Ancak YOLOv5 , eşsiz kullanım kolaylığı, kararlılığı ve geniş dağıtım desteği nedeniyle birçok kişi için pratik bir seçim olmaya devam etmektedir.

İleriye dönük projeler için öneri açıktır: Ultralytics benimseyin. YOLOv5 kullanıcı dostu ekosistemini, hız, doğruluk ve basitlik açısından önceki sürümleri geride bırakan mimari YOLOv5 birleştirir.

Ultralytics Hub'ı ziyaret ederek bu mimarileri daha ayrıntılı olarak inceleyin ve bir sonraki projeniz için önceden eğitilmiş ağırlıkları indirin.


Yorumlar