İçeriğe geç

YOLOv7 YOLOv10: Gerçek Zamanlı Algılama için Mimari Karşılaştırması

Nesne algılama modellerinin gelişimi, daha yüksek doğruluk ve daha düşük gecikme süresi için sürekli bir çaba ile karakterize edilmiştir. Bu yolculuktaki iki önemli dönüm noktası şunlardır YOLOv7ve YOLOv10'dir. Her iki mimari de piyasaya sürüldükleri anda en son teknolojiyi temsil etseler de, temelde farklı tasarım felsefelerini yansıtmaktadırlar. YOLOv7 , "bag-of-freebies" yoluyla eğitim sürecini optimize etmeye YOLOv7 , YOLOv10 , Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldıran uçtan uca bir yaklaşımın YOLOv10 .

Bu kılavuz, araştırmacıların ve mühendislerin bilgisayar görme projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla ayrıntılı bir teknik karşılaştırma sunmaktadır. Mimariyi, performans ölçütlerini ve dağıtım iş akışlarını analiz ederek, YOLOv10gibi modern yinelemelerin ve daha yeni olan YOLO26gibi modern yinelemelerin genellikle ölçeklenebilir AI çözümleri için tercih edilen seçenek olduğunu gösteriyoruz.

Model Performans Karşılaştırması

Aşağıdaki tablo, iki model arasındaki performans farklarını göstermektedir. YOLOv10 , özellikle daha küçük model varyantlarında, YOLOv7 kıyasla YOLOv10 daha düşük gecikme süresi ve daha yüksek verimlilik (daha az parametre ve FLOP) sunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv7: Ücretsiz Hediyelerle Dolu Güç Merkezi

Temmuz 2022'de piyasaya sürülen YOLOv7 , çıkarım maliyetlerini artırmadan eğitim sürecini optimize etmek için geliştirildi. Yazarlar, eğitim sırasında doğruluğu artıran ancak çıkarım sırasında atılan ve modelin hızlı kalmasını sağlayan optimizasyon yöntemlerini ifade eden "eğitilebilir bag-of-freebies" adlı bir kavramı tanıttı.

Önemli Teknik Detaylar:

YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) özelliğini YOLOv7 . Bu mimari, en kısa ve en uzun gradyan yollarını etkili bir şekilde kontrol ederek modelin daha çeşitli özellikleri öğrenmesini sağlar. Ek olarak, mimari özelliklerini (derinlik ve genişlik gibi) aynı anda değiştiren model ölçeklendirme teknikleri kullanarak farklı boyutlarda optimum performans sağlar. COCO yüksek performansa sahip olmasına rağmen, YOLOv7 esas olarak çapa tabanlı bir YOLOv7 ve bu da bazen modern çapa içermeyen alternatiflere kıyasla hiperparametre ayarlamasını karmaşık hale getirebilir.

YOLOv7 hakkında daha fazla bilgi edinin.

YOLOv10: Gerçek Zamanlı Uçtan Uca Nesne Algılama

Tsinghua Üniversitesi araştırmacıları tarafından Mayıs 2024'te yayınlanan YOLOv10 , NMS eğitimi tanıtarak YOLO önemli bir değişime imza attı.

Önemli Teknik Detaylar:

YOLOv10 , gerçek zamanlı algılamada uzun süredir var olan bir darboğazı YOLOv10 : son işlem için Non-Maximum Suppression (NMS) yöntemine bağımlılık. Tutarlı çift atamalar kullanarak, YOLOv10 uçtan uca eğitim YOLOv10 ve modelin doğrudan nihai tahminler üretmesini sağlar. NMS kaldırılması, özellikle son işlem yükünün maliyetli olduğu uç cihazlarda, çıkarım gecikmesini NMS azaltır ve dağıtım süreçlerini basitleştirir. Ayrıca, bütünsel verimlilik-doğruluk odaklı model tasarımı, hafif sınıflandırma başlığı ve uzamsal kanal ayrıştırılmış aşağı örnekleme gibi çeşitli bileşenleri optimize ederek hesaplama fazlalığını azaltır.

YOLOv10 hakkında daha fazla bilgi edinin.

Eleştirel Karşılaştırma: Mimari ve Kullanılabilirlik

Her iki model de güçlü olmakla birlikte, mimarilerindeki farklılıklar ideal kullanım alanlarını belirlemektedir.

NMS vs. Çapa Tabanlı

En belirgin fark, son işlem gereksinimidir. YOLOv7 , üst üste binen sınırlayıcı kutuları filtrelemek NMS YOLOv7 . Etkili olmasına rağmen, NMS , algılanan nesnelerin sayısıyla orantılı olarak gecikme süresi NMS ve tahmin süresini değişken hale getirir. Buna karşın, YOLOv10 uçtan uca tasarımı, otonom araçlar gibi güvenlik açısından kritik gerçek zamanlı uygulamalar için çok önemli olan belirleyici çıkarım süreleri sağlar.

Verimlilik ve Kaynak Kullanımı

YOLOv10 üstün verimlilik YOLOv10 . Karşılaştırma tablosunda gösterildiği gibi, YOLOv10b, YOLOv7 ile karşılaştırılabilir bir doğruluk elde ederken, parametre sayısı yaklaşık %65 daha azdır. Model boyutundaki bu önemli azalma, daha düşük bellek tüketimi anlamına gelir ve YOLOv10 mobil uygulamalar veya IoT cihazları gibi bellek kısıtlı ortamlar için YOLOv10 uygun hale getirir.

Bellek Verimliliği

Kenar cihazlarını hedefleyen geliştiriciler için, YOLOv10 azaltılmış parametre sayısı, çıkarım sırasında önemli ölçüde daha az RAM kullanımı YOLOv10 . Bu, aynı donanım üzerinde daha büyük parti boyutlarının çalıştırılmasına veya diğer AI modelleriyle birlikte çoklu görevlerin gerçekleştirilmesine olanak tanır.

Eğitim ve Ekosistem

Bir modeli çevreleyen ekosistem, geliştiriciler için modelin pratikliğini belirler. Ultralytics bu noktada öne çıkıyor. Her iki modele de, kullanıcı deneyimini birleştiren Ultralytics Python aracılığıyla erişilebilir.

  • Kullanım Kolaylığı: Tek bir dizeyi değiştirerek modeller arasında geçiş yapabilirsiniz (örneğin, model = YOLO("yolov10n.pt")).
  • Birleştirilmiş Modlar: Ultralytics , eğitim, doğrulama ve ONNX, TensorRT ve CoreML gibi formatlara aktarım için komutları Ultralytics
  • Eğitim Verimliliği: Ultralytics , ham PyTorch kıyasla daha düşük CUDA kullanımı için optimize edilmiştir, bu da tüketici GPU'larında daha büyük parti boyutlarına olanak tanır.
from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (swappable with YOLOv7)
model = YOLO("yolov10n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

Gelecek: YOLO26

YOLOv7 YOLOv10 mükemmel YOLOv10 da, bu alan hızla gelişmektedir. Yeni piyasaya sürülen YOLO26 (Ocak 2026), YOLOv10 NMS temelini temel alır, YOLOv10 daha da yüksek hız ve doğruluk için yeni yenilikler getirir.

  • Uçtan uca NMS: YOLOv10 gibi, YOLO26 de doğal olarak uçtan uca olup, deterministik gecikme süresini garanti eder.
  • MuSGD Optimizatörü: LLM eğitiminden ilham alan bu hibrit optimizatör, kararlı eğitim ve daha hızlı yakınsama sağlar.
  • Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) kaldırıldığından, YOLO26 CPU %43'e kadar daha hızlıdır, bu da onu kenar bilişim için üstün bir seçim haline getirir.
  • Çok yönlülük: YOLO26, OBB, poz tahmini ve segmentasyon dahil tüm görevleri destekler.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

YOLOv7 YOLOv10 arasında seçim yapmak, özel kısıtlamalarınıza YOLOv10 .

  • YOLOv7, belirli mimarisi için optimize edilmiş eski sistemleri sürdürüyorsanız veya araştırma karşılaştırması için belirli "bag-of-freebies" özelliklerine ihtiyacınız varsa seçin.
  • Düşük gecikme süresi ve yüksek verimlilik gerektiren yeni dağıtımlar için YOLOv10 seçin. NMS tasarımı ve azaltılmış parametre sayısı, onu gerçek zamanlı uç uygulamalar için ideal hale getirir.

Ancak, hız, doğruluk ve kullanım kolaylığı arasında en iyi dengeyi sağlamak için en son YOLO26 sürümünü incelemenizi öneririz. Güçlü Ultralytics tarafından desteklenen bu sürüm, bilgisayar görme geliştirme için geleceğe dönük en uygun çözümü sunar.

Daha Fazla Okuma


Yorumlar