YOLOv7 vs YOLOv10: Gerçek Zamanlı Nesne Algılamanın Evrimi
Bilgisayar görüşü alanı, son birkaç yılda dikkate değer ilerlemelere tanık oldu ve YOLO (You Only Look Once) model ailesi gerçek zamanlı nesne tespitinde öncülük etti. Bilgisayar görüşü projeleriniz için doğru mimariyi seçmek, mevcut seçenekler hakkında derinlemesine bir anlayış gerektirir. Bu kapsamlı teknik karşılaştırmada, iki dönüm noktası niteliğindeki mimari arasındaki temel farkları inceleyeceğiz: YOLOv7 ve YOLOv10.
Modellere Giriş
Bu modellerin her ikisi de yapay zeka tarihinde önemli dönüm noktalarını temsil etmekle birlikte, nesne tespiti zorluklarını çözmek için temelden farklı yaklaşımlar benimsemektedirler.
YOLOv7: 'Bag-of-Freebies' Öncüsü
Institute of Information Science, Academia Sinica'dan araştırmacılar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından 6 Temmuz 2022'de yayınlanan YOLOv7, sinir ağlarının nasıl optimize edildiğine dair bir paradigma değişimi getirdi. Kendi akademik makalelerinde detaylandırılan ve resmi GitHub depolarında barındırılan orijinal araştırma, mimari yeniden parametrelendirme ve eğitilebilir bir "bedelsiz özellikler çantası" üzerine yoğunlaştı.
YOLOv7, orijinal gradyan yolunu bozmadan ağın çeşitli özellikleri öğrenmesine rehberlik etmek için genişletilmiş verimli katman toplama ağı (E-ELAN) kullanır. Bu, onu akademik araştırma kıyaslamaları ve standart üst düzey GPU'lara büyük ölçüde bağımlı sistemler için sağlam bir seçim haline getirir.
YOLOv7 hakkında daha fazla bilgi edinin.
YOLOv10: Gerçek Zamanlı Uçtan Uca Algılama
Tsinghua Üniversitesi'nden Ao Wang ve ekibi tarafından geliştirilen YOLOv10, 23 Mayıs 2024'te yayınlandı. Kendi arxiv yayınında ve Tsinghua GitHub deposunda detaylandırıldığı üzere, bu model nesne tespitindeki uzun süredir devam eden bir darboğazı ortadan kaldırıyor: Non-Maximum Suppression (NMS).
YOLOv10, NMS içermeyen eğitim için tutarlı ikili atamalar sunarak, işlem sonrası hattını temelden değiştirdi. Bütünsel bir verimlilik-doğruluk odaklı model tasarım stratejisi uygulayarak, YOLOv10 hesaplama fazlalığını azaltır. Bu, son derece düşük gecikme süresi gerektiren kenar cihazlar için benzersiz bir şekilde tasarlanmış bir mimariyle sonuçlanır.
YOLOv10 hakkında daha fazla bilgi edinin.
NMS'siz Mimari
YOLOv10'da Non-Maximum Suppression (NMS) kaldırılması, tüm modelin tek bir hesaplama grafiği olarak dışa aktarılmasına olanak tanır. Bu, TensorRT veya OpenVINO gibi çalışma zamanı ortamları kullanılarak dağıtımı büyük ölçüde basitleştirir.
Performans ve Metrik Karşılaştırması
Model performansını analiz ederken, hassasiyet, hız ve hesaplama ağırlığı arasındaki dengeyi değerlendirmek çok önemlidir. Aşağıdaki tablo, bu modellerin farklı boyutlarının birbirleriyle nasıl karşılaştırıldığını göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Dengelerin Analizi
Yukarıdaki metrikler, belirgin bir nesil farkını ortaya koymaktadır. YOLOv7x %53,1'lik çok güçlü bir mAPval sunarken, 71,3 milyon parametre ve 189,9 milyar FLOP gerektirir. Buna karşılık, YOLOv10l bu doğruluğu (%53,3 mAP) aşarken, parametrelerin yarısından daha azını (29,5 milyon) ve önemli ölçüde daha az FLOP'u (120,3 milyar) gerektirir. Ayrıca, yüksek düzeyde optimize edilmiş YOLOv10n, 1,56 ms'lik şaşırtıcı bir çıkarım hızı sağlayarak, gerçek zamanlı video analizi ve mobil uygulamalar için idealdir.
Gerçek Dünya Kullanım Durumları
Bu modeller arasındaki mimari farklılıklar, en uygun kullanım durumlarını belirler.
YOLOv7 Ne Zaman Kullanılmalı
Zengin özellik temsili sayesinde YOLOv7, oldukça karmaşık ortamlarda üstün performans gösterir. Yoğun kentsel alanlarda trafik akışını izleme, uydu görüntülerini analiz etme veya ağır üretim otomasyonundaki kusurları tespit etme gibi kullanım durumları, sağlam yapısal yeniden parametrelendirmesinden faydalanır. Ayrıca, belirli PyTorch 1.12 işlem hatlarıyla zaten derinlemesine entegre olan eski ortamlarda da oldukça tercih edilir.
YOLOv10 Ne Zaman Kullanılır
YOLOv10'un NMS içermeyen, hafif tasarımı kısıtlı ortamlarda öne çıkar. NVIDIA Jetson Nano veya Raspberry Pi gibi kenar bilişim cihazları için şiddetle tavsiye edilir. Düşük gecikmeli performansı, spor analizi, otonom drone navigasyonu ve konveyör bantlarında yüksek hızlı robotik sıralama gibi hızlı hareket eden uygulamalar için mükemmeldir.
Ultralytics Ekosisteminin Avantajı
Her iki model de güçlü akademik köklere sahip olsa da, gerçek potansiyelleri birleşik Ultralytics Platformu içinde kullanıldığında ortaya çıkar. Bilgisayar görüşü modellerini sıfırdan geliştirmek oldukça zordur, ancak Ultralytics ekosistemi makine öğrenimi mühendisleri için eşsiz bir deneyim sunar.
- Kullanım Kolaylığı: Ultralytics Python API'si birleşik bir arayüz sağlar. Yalnızca birkaç satır kodla modelleri eğitebilir, doğrulayabilir ve dışa aktarabilir, böylece tipik akademik depolarda karşılaşılan karmaşık bağımlılık kabuslarından kaçınabilirsiniz.
- İyi Yönetilen Ekosistem: Ultralytics, temel kodun aktif olarak geliştirildiğini garanti eder. Kullanıcılar, günlükleme için Weights & Biases veya hızlı web demoları için Hugging Face gibi popüler ML araçlarıyla sorunsuz entegrasyonlardan faydalanır.
- Bellek Gereksinimleri: Transformer tabanlı nesne dedektörleri, eğitim sırasında genellikle büyük miktarda CUDA belleği tüketir. Buna karşılık, Ultralytics YOLO modelleri çok daha az bellek gerektirir, bu da tüketici sınıfı donanımlarda çok daha büyük toplu iş boyutlarına olanak tanır.
- Çok Yönlülük: Ultralytics işlem hattı, standart sınırlayıcı kutularla sınırlı değildir. Desteklenen YOLO11 ve YOLOv8 gibi model ailelerinde poz tahmini, örnek segmentasyonu ve yönlendirilmiş sınırlayıcı kutuları sorunsuz bir şekilde destekler.
Kolaylaştırılmış Eğitim Örneği
Ultralytics ile bir eğitim hattı çalıştırmak oldukça basittir. İster YOLOv7'nin tarihsel sağlamlığından ister YOLOv10'un NMS içermeyen hızından yararlanın, sözdizimi tutarlı kalır:
from ultralytics import YOLO
# Load the preferred model (e.g., YOLOv10 Nano)
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an inference prediction on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to an edge-friendly format like ONNX
model.export(format="onnx")
Kullanım Durumları ve Öneriler
YOLOv7 ve YOLOv10 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.
YOLOv7 Ne Zaman Tercih Edilmeli?
YOLOv7, şunlar için güçlü bir seçenektir:
- Akademik Kıyaslama: 2022 dönemi son teknoloji sonuçlarını yeniden üretmek veya E-ELAN ve eğitilebilir 'bag-of-freebies' tekniklerinin etkilerini incelemek.
- Yeniden Parametrelendirme Araştırması: Planlı yeniden parametrelendirilmiş evrişimleri ve bileşik model ölçekleme stratejilerini araştırmak.
- Mevcut Özel İşlem Hatları: YOLOv7'nin özel mimarisi etrafında inşa edilmiş, yoğun şekilde özelleştirilmiş ve kolayca yeniden düzenlenemeyen işlem hatlarına sahip projeler.
YOLOv10 Ne Zaman Tercih Edilmeli?
YOLOv10 şunlar için önerilir:
- NMS-Serbest Gerçek Zamanlı Algılama: Non-Maximum Suppression olmadan uçtan uca algılamadan faydalanan, dağıtım karmaşıklığını azaltan uygulamalar.
- Dengeli Hız-Doğruluk Dengelemeleri: Çeşitli model ölçeklerinde çıkarım hızı ve algılama doğruluğu arasında güçlü bir denge gerektiren projeler.
- Tutarlı Gecikme Süreli Uygulamalar: Tahmin edilebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları, örneğin robotik veya otonom sistemler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Gelecek: YOLO26'nın Tanıtımı
YOLOv7 ve YOLOv10 etkileyici dönüm noktaları olsa da, yapay zekanın sınırı her zaman ilerlemektedir. Ocak 2026'da yayınlanan Ultralytics YOLO26, tüm kenar ve bulut dağıtım senaryolarında verimlilik ve doğruluk için tartışmasız yeni standarttır.
Bugün yeni bir bilgisayar görüşü projesine başlıyorsanız, YOLO26 önerilen mimaridir. Öncüllerinin mirası üzerine inşa edilmiş olup, çığır açan birçok yeniliği bünyesinde barındırır:
- Uçtan Uca NMS-Serbest Tasarım: YOLOv10'dan ilham alan YOLO26, NMS son işlemeyi doğal olarak ortadan kaldırarak deterministik gerçek zamanlı robotik uygulamalar için ultra düşük gecikmeli çıkarım sağlar.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağıtım Odak Kaybı (DFL) modülünü stratejik olarak kaldırarak, YOLO26, GPU olmayan uç bilişim donanımlarında yürütmeyi önemli ölçüde hızlandırır ve bu da onu IoT cihazları için güçlü bir çözüm haline getirir.
- MuSGD Optimizatörü: Son büyük dil modeli eğitim yeniliklerinden ilham alan YOLO26, SGD ve Muon'un bir hibritini birleştirerek eğitim yollarını stabilize eder ve daha hızlı yakınsamayı garanti eder.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada önemli iyileştirmeler sağlayarak, eski YOLO nesillerindeki tarihsel bir zayıflığı aşar.
- Eşsiz Çok Yönlülük: YOLO26, poz izleme için Artık Log-Olabilirlik Tahmini (RLE) ve hava görüntülerinde hassas OBB tespiti için özel açı kayıpları gibi yerel, göreve özel optimizasyonlar sunar.
Hız, doğruluk ve dağıtım basitliğinin nihai dengesini arayan mühendisler için, eski modellerden YOLO26'ya geçiş anında ve ölçülebilir bir rekabet avantajı sağlar.