YOLOv7 ve YOLO11: Gerçek Zamanlı Algılayıcıların Teknik Karşılaştırması
Nesne algılama mimarilerinin evrimi, hız, doğruluk ve dağıtım kolaylığındaki hızlı gelişmelerle belirginleşmiştir. Bu kılavuz, 2022'den kalma son teknoloji bir model olan YOLOv7 ile Ultralytics'in 2024'teki en yeni sürümü olan YOLO11 arasında derinlemesine bir teknik karşılaştırma sunmaktadır. Mimari farklılıklarını, performans metriklerini ve modern bilgisayar görüşü uygulamaları için uygunluklarını analiz ediyoruz.
Yönetici Özeti
YOLOv7, E-ELAN gibi önemli mimari iyileştirmeler sunarken, YOLO11 kullanılabilirlik, ekosistem desteği ve verimlilik açısından nesiller arası bir sıçramayı temsil etmektedir. YOLO11, modern donanımlarda üstün performans, önemli ölçüde daha kolay eğitim iş akışları ve basit detect'in ötesinde daha geniş bir görev yelpazesi için yerel destek sunar.
| Özellik | YOLOv7 | YOLO11 |
|---|---|---|
| Mimari | E-ELAN, Birleştirmeye Dayalı | C3k2, SPPF, GPU için Optimize Edilmiş |
| Görevler | detect, Pose, segment (sınırlı) | Detect, Segment, Classify, Pose, OBB, Track |
| Kullanım Kolaylığı | Yüksek karmaşıklık (birden fazla betik) | Kolaylaştırılmış (Birleşik python API'si) |
| Ekosistem | Dağınık (Araştırma odaklı) | Entegre (Ultralytics Ekosistemi) |
| Dağıtım | Manuel dışa aktarma betikleri gerektirir | 10'dan fazla formata tek satırlık dışa aktarma |
Detaylı Analiz
YOLOv7: "Bag-of-Freebies" Mimarisi
Temmuz 2022'de yayınlanan YOLOv7, çıkarım maliyetini artırmadan eğitim sürecini optimize ederek gerçek zamanlı nesne detect'in sınırlarını zorlamak için tasarlandı; bu, "bag-of-freebies" olarak bilinen bir kavramdır.
Temel Teknik Özellikler:
- E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı): Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikler öğrenmesini ve yakınsamayı iyileştirmesini sağlar.
- Model Ölçeklendirme: YOLOv7, farklı kaynak kısıtlamaları için derinliği ve genişliği eş zamanlı olarak değiştiren bileşik ölçeklendirme yöntemleri tanıttı.
- Yardımcı Başlık: Daha derin katmanlardaki öğrenme sürecini denetlemeye yardımcı olan bir yardımcı başlığın bulunduğu "kabadan inceye" yönlendirilmiş bir etiket atayıcı kullanır.
YOLOv7 Detayları:
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica
- Tarih: 2022-07-06
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
YOLOv7 hakkında daha fazla bilgi edinin.
YOLO11: Gelişmiş Verimlilik ve Çok Yönlülük
YOLO11, Ultralytics'in ham performansın yanı sıra geliştirici deneyimine öncelik verme mirası üzerine inşa edilmiştir. Yüksek doğruluğu korurken hesaplama yükünü azaltan mimari iyileştirmeler sunarak hem uç cihazlarda hem de bulut GPU'larında olağanüstü hızlı çalışmasını sağlar.
Temel Teknik Özellikler:
- C3k2 Bloğu: Önceki sürümlerde kullanılan CSP (Cross Stage Partial) darboğazının bir evrimi olup, daha az parametreyle daha iyi özellik çıkarımı sunar.
- Geliştirilmiş SPPF: Spatial Pyramid Pooling - Fast katmanı, çok ölçekli bağlamı daha verimli bir şekilde yakalamak için optimize edilmiştir.
- Görev Çok Yönlülüğü: Esas olarak bazı poz yeteneklerine sahip bir tespit modeli olan YOLOv7'nin aksine, YOLO11 baştan itibaren Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Sınırlayıcı Kutular (obb) ve Sınıflandırmayı doğal olarak ele almak üzere tasarlanmıştır.
- Optimize Edilmiş Eğitim: YOLO11, eğitimi stabilize eden gelişmiş veri artırma stratejileri ve iyileştirilmiş kayıp fonksiyonları kullanarak kullanıcıdan daha az hiperparametre ayarı gerektirir.
YOLO11 Detayları:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 2024-09-27
- Belgeler: Resmi Belgeler
YOLO11 hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Bu modelleri karşılaştırırken, hız (gecikme) ve doğruluk (mAP) arasındaki ödünleşime bakmak çok önemlidir. YOLO11 genellikle daha iyi bir denge sunarak, NVIDIA T4 gibi modern GPU'larda önemli ölçüde daha düşük hesaplama gereksinimleri (FLOPs) ve daha hızlı çıkarım hızları ile yüksek doğruluk sağlar.
Verimlilik Önemlidir
YOLO11, daha az parametreyle eski modellere göre benzer veya daha iyi doğruluk elde eder. Bu "parametre verimliliği", eğitim sırasında daha düşük bellek kullanımına ve NVIDIA Jetson Orin Nano gibi uç cihazlarda daha hızlı yürütmeye doğrudan dönüşür.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Tabloda gösterildiği gibi, YOLO11x, benzer GPU çıkarım hızlarını korurken doğrulukta (54.7% vs 53.1%) YOLOv7-X'i geride bırakır. Daha da önemlisi, YOLO11'in daha küçük varyantları (n/s/m), video analizi gibi gerçek zamanlı işlemenin kritik olduğu uygulamalar için inanılmaz hız avantajları sunar.
Ekosistem ve Kullanım Kolaylığı
Geliştiriciler için en önemli farklılaştırıcı, modeli çevreleyen ekosistemdir. Ultralytics modelleri işte burada öne çıkar.
Ultralytics'in Avantajı
YOLO11 , ultralytics python paketi, tüm makine öğrenimi yaşam döngüsü için birleşik bir arayüz sağlar.
- Basit API: Yalnızca birkaç satır python koduyla bir modeli yükleyebilir, eğitebilir ve doğrulayabilirsiniz.
- İyi Yönetilen Ekosistem: Ultralytics topluluğu, veri yönetimi için Ultralytics Platformu gibi araçlarla aktif destek, sık güncellemeler ve sorunsuz entegrasyon sağlar.
- Dağıtım Esnekliği: YOLO11'i ONNX, TensorRT, CoreML veya TFLite'a dışa aktarmak tek bir komut gerektirir. Buna karşılık, YOLOv7 genellikle farklı dışa aktarma formatları için karmaşık üçüncü taraf depoları veya manuel komut dosyası ayarlamaları gerektirir.
Kod Karşılaştırması:
YOLO11 Eğitimi:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
YOLOv7 Eğitimi: Genellikle depoyu klonlamayı, belirli bağımlılıkları yüklemeyi ve uzun komut satırı argümanları çalıştırmayı gerektirir:
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'
Gerçek Dünya Kullanım Durumları
YOLOv7 Ne Zaman Tercih Edilmeli?
- Eski Kıyaslama: Akademik araştırma yapıyorsanız ve yeni mimarileri 2022'nin en son teknoloji standartlarıyla karşılaştırmanız gerekiyorsa.
- Özel Uygulamalar: Belirli YOLOv7 giriş/çıkış tensor yapıları etrafında yoğun bir şekilde özelleştirilmiş mevcut bir hattınız varsa ve yeniden düzenlemeye gücünüz yetmiyorsa.
Ne Zaman YOLO11 Seçmeli
- Üretim Dağıtımı: Güvenilirliğin ve bakım kolaylığının çok önemli olduğu perakende, güvenlik veya üretimdeki ticari uygulamalar için.
- Uç Bilişim: YOLO11n ve YOLO11s'in verimliliği, onları Raspberry Pi veya sınırlı güce sahip mobil cihazlarda çalıştırmak için ideal kılar.
- Çok Görevli Uygulamalar: Projeniz nesneleri detect etmeyi, segment etmeyi ve pozlarını eş zamanlı olarak tahmin etmeyi gerektiriyorsa, YOLO11 bunu yerel olarak halleder.
En Son Teknoloji: YOLO26
YOLO11 çoğu uygulama için mükemmel bir seçenek olsa da, Ultralytics yenilik yapmaya devam ediyor. Yakın zamanda piyasaya sürülen YOLO26 (Ocak 2026) sınırları daha da zorluyor.
- Uçtan Uca NMS'siz: YOLO26, Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak daha basit dağıtım hatları ve daha düşük gecikme süresi sağlar.
- Uç Optimizasyonu: Distribution Focal Loss (DFL) kaldırarak, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder ve bu da onu uç yapay zeka için üstün bir seçenek haline getirir.
- MuSGD Optimizer: LLM eğitiminden esinlenilen bu hibrit optimizer, istikrarlı bir yakınsama sağlar.
Bugün yeni bir yüksek performanslı proje başlatan geliştiriciler için YOLO26'yı keşfetmeleri şiddetle tavsiye edilir.
YOLO26 hakkında daha fazla bilgi edinin
Sonuç
Hem YOLOv7 hem de YOLO11, bilgisayar görüşü tarihinde birer dönüm noktasıdır. YOLOv7, alanı ileri taşıyan güçlü mimari konseptler tanıttı. Ancak, YOLO11 bu fikirleri daha pratik, daha hızlı ve kullanıcı dostu bir pakette geliştirir.
Araştırmacılardan kurumsal mühendislere kadar kullanıcıların büyük çoğunluğu için YOLO11 (veya daha yeni YOLO26), sağlam Ultralytics Platformu tarafından desteklenen doğruluk, hız ve geliştirici deneyiminin en iyi kombinasyonunu sunar.
Keşfedilecek Diğer Modeller
- YOLO26: Üstün hız ve doğruluk için en son NMS'siz model.
- YOLOv10: Gerçek zamanlı detect için NMS'siz eğitimin öncüsü.
- RT-DETR: Yüksek doğruluk senaryoları için transformatör tabanlı bir dedektör.
- SAM 2: Meta'nın Segment Anything Modeli, sıfır atışlı segmentasyon için.