YOLO11 ile YOLOv7: Ayrıntılı Teknik Karşılaştırma

Bilgisayarlı görü dünyası hızla evrilmeye devam ediyor ve gerçek zamanlı nesne tespiti, yapay zeka uygulamalarının ön saflarında yer almayı sürdürüyor. Projen için doğru mimariyi seçmek, hız, doğruluk ve dağıtım kolaylığı arasındaki karmaşık dengeleri yönetmeyi gerektirir. Bu kılavuzda, öne çıkan iki mimari olan Ultralytics YOLO11 ve YOLOv7 arasında kapsamlı bir teknik karşılaştırma sunuyoruz.

Model Geçmişi ve Teknik Detaylar

Her iki model de derin öğrenme topluluğunu önemli ölçüde etkiledi, ancak farklı geliştirme felsefelerinden ve dönemlerden geliyorlar.

YOLO11 Detayları:
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Dokümantasyon: https://docs.ultralytics.com/models/yolo11/

YOLO11 hakkında daha fazla bilgi edin

YOLOv7 Detayları:
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Dokümantasyon: https://docs.ultralytics.com/models/yolov7/

YOLOv7 hakkında daha fazla bilgi edinin

Mimari Farklılıklar

İç mekanizmaları analiz ettiğimizde, her iki dedektör de en modern kavramları kullanıyor ancak yapısal temelleri farklılık gösteriyor.

YOLOv7, Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN) kavramını tanıttı. Bu mimari, araştırma makalelerinde belirtilen önemli bir atılım olarak, orijinal gradyan yolunu bozmadan ağın öğrenme yeteneğini sürekli olarak geliştirmek için tasarlanmıştır. YOLOv7, eğitim sırasında büyük ölçüde yapısal yeniden parametrelendirmeye ve sağlam bir "bedava ekstralar" (bag-of-freebies) metodolojisine güvenerek, çıkarım maliyetlerini artırmadan COCO dataset üzerindeki genel doğruluğu iyileştirir.

Buna karşılık YOLO11, son derece optimize edilmiş Ultralytics mimarisi üzerine kurulmuştur. Daha az parametreyle daha rafine bir özellik çıkarımı hattına odaklanarak eğitim sırasında daha düşük bellek kullanımı sağlar. YOLO11, daha ağır modellerin tespit doğruluğunu yakalarken veya geçerken daha az hesaplama kaynağı (FLOPs) kullanarak çok avantajlı bir performans dengesi elde eder. Ayrıca YOLO11, daha geniş bir görev yelpazesini doğal olarak destekler, bu da onu modern bilgisayarlı görü uygulamaları için çok yönlü bir seçenek haline getirir.

Bellek Verimliliği

Ultralytics YOLO modellerinin en dikkat çekici özelliklerinden biri, diğer son teknoloji modellere kıyasla eğitim sırasında daha düşük bellek gereksinimidir; bu da geliştiricilerin tüketici seviyesindeki PyTorch donanımlarında güçlü ağlar eğitmelerine olanak tanır.

Performans ve Metrik Karşılaştırması

Gerçek dünya uygulanabilirliğini doğru bir şekilde ölçmek için ortalama Hassasiyet (mAP), çıkarım hızı, model parametreleri ve hesaplama karmaşıklığı (FLOPs) gibi metrikleri değerlendirmek önemlidir. Aşağıdaki tablo, YOLO11 ölçekleme varyantlarının daha büyük YOLOv7 modelleriyle nasıl karşılaştırıldığını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Görüldüğü üzere, YOLO11x gibi bir model, YOLOv7x'in 53.1 mAP değerine kıyasla 54.7 mAP gibi daha yüksek bir değere ulaşırken, çok daha az parametre (56.9M'ye karşı 71.3M) kullanır. Bu, YOLO11'in üstün mimari verimliliğini öne çıkarır.

Eğitim Verimliliği ve Ekosistem Kullanılabilirliği

Bu iki mimariyi ayıran en belirgin özelliklerden biri, geliştirici deneyimi ve çevreleyen ekosistemdir.

YOLOv7, temel olarak akademik bir araştırma deposudur. Modelleri eğitmek genellikle karmaşık ortam kurulumları, bağımlılıkları manuel olarak yönetme ve uzun komut satırı argümanları kullanmayı gerektirir. En son deneyleri desteklese de, YOLOv7 GitHub deposu kodunu özel üretim ortamları için uyarlamak zaman alıcı olabilir.

YOLO11 kullanım kolaylığını tamamen yeniden tanımlar. Sorunsuz uçtan uca iş akışları sunan, kapsamlı ve iyi yönetilen bir ekosistem olan Ultralytics Platform ile tamamen entegredir. Veri etiketlemeden yerel eğitime ve dağıtıma kadar, birleştirilmiş Python API ve basit komut satırı arayüzü tüm süreci hızlandırır.

Kod Karşılaştırması

YOLO11 ile bir nesne tespit modeli eğitmek sadece birkaç satır kod gerektirir, bu da giriş engelini önemli ölçüde düşürür:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Quickly export to ONNX format
model.export(format="onnx")

Buna karşılık, tipik bir YOLOv7 eğitim komutu şu şekildedir ve yolların, yapılandırma dosyalarının ve bash betiklerinin dikkatli bir şekilde ayarlanmasını gerektirir:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

YOLO11 aynı zamanda muazzam bir çok yönlülük sağlar. YOLOv7, tespitten öte görevleri (poz veya segmentasyon gibi) desteklemek için tamamen farklı kod tabanları veya ağır değişiklikler gerektirirken, YOLO11 nesne tespiti, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve Yönelimli Sınırlayıcı Kutu (OBB) tespit işlemlerini tek ve uyumlu bir çerçeve üzerinden halleder.

Dışa Aktarma Çok Kolay

YOLO11'i TensorRT veya OpenVINO gibi formatlara dışa aktarmak sadece tek bir komut gerektirir, bu da eski modellerde karşılaşılan tipik operatör desteği sorunlarını ortadan kaldırır.

Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları

YOLOv7 ile YOLO11 arasında seçim yapmak tamamen proje kapsamına ve dağıtım kısıtlamalarına bağlıdır.

Ne zaman YOLOv7 düşünülmeli:

  • Eski Modellerin Kıyaslanması: Gradyan yolu tasarımlarını keşfeden akademik araştırmacılar, daha yeni evrişimli sinir ağlarını değerlendirmek için YOLOv7'yi bir temel model olarak kullanabilirler.
  • Mevcut Özel İş Akışları: Özellikle YOLOv7'nin benzersiz sınırlayıcı kutu kod çözme mantığı üzerine kurulmuş, ağır şekilde özelleştirilmiş C++ veya CUDA iş akışlarına sahip ekipler.

Ne zaman YOLO11 seçilmeli:

  • Ticari Üretim: Akıllı perakende veya sağlık teşhisi uygulamaları, YOLO11'in bakımlı kod tabanından ve yüksek kararlılığından büyük ölçüde yararlanır.
  • Kaynak Kısıtlı Ortamlar: YOLO11n'nin hafif ayak izi, ONNX aracılığıyla mobil ve uç cihazlarda dağıtım için onu son derece uygun kılar.
  • Çok Görevli Projeler: Tek bir uygulamanın bir kişiyi tanımlaması, iskeletini (poz) haritalaması ve tuttuğu bir nesneyi bölütlemesi gerekiyorsa, YOLO11 birleşik bir çözüm sunar.

En İleri Nokta: YOLO26 ile İlerlemek

YOLO11 son derece sağlam bir seçenek olsa da, yapay zekadaki inovasyon asla durmaz. Bugün yeni projeler başlatan mühendisler için Ultralytics YOLO26 seçeneğini incelemeleri şiddetle önerilir.

Ocak 2026'da piyasaya sürülen YOLO26, uçtan uca NMS-Free (NMS'siz) bir Tasarım getirerek, Non-Maximum Suppression (Maksimum Olmayan Baskılama) sonrası işleme ile ilişkili gecikme darboğazlarını tamamen ortadan kaldırır. Ayrıca YOLO26, daha hızlı yakınsama sağlamak için LLM eğitim metodolojilerinden esinlenen devrim niteliğindeki MuSGD Optimizer'ı içerir. ProgLoss + STAL ile hedeflenen kayıp iyileştirmeleri ve DFL kaldırma sayesinde %43'e kadar daha hızlı CPU çıkarımı ile YOLO26, özellikle uç bilişim için optimize edilmiştir ve vizyon yapay zekasının mevcut zirvesini temsil eder.

YOLO26 hakkında daha fazla bilgi edin

Özel alternatif yapılarla ilgilenen kullanıcılar için, transformer tabanlı RT-DETR veya dinamik açık kelime dağarcıklı YOLO-World modellerini keşfetmek de çeşitli bilgisayarlı görü dağıtımları için faydalı sonuçlar verebilir.

Yorumlar