İçeriğe geç

YOLO11 ve YOLOv7: Ayrıntılı Bir Teknik Karşılaştırma

Bilgisayar görüşü alanı hızla gelişmeye devam ederken, gerçek zamanlı nesne algılama yapay zeka uygulamalarının ön saflarında yer almaktadır. Projeniz için doğru mimariyi seçmek, hız, doğruluk ve dağıtım kolaylığı arasındaki karmaşık bir dengeyi yönetmeyi gerektirir. Bu kılavuzda, iki önde gelen mimari olan Ultralytics YOLO11 ve YOLOv7 arasında kapsamlı bir teknik karşılaştırma sunuyoruz.

Model Arka Planı ve Teknik Detaylar

Her iki model de derin öğrenme topluluğunu önemli ölçüde etkilemiştir, ancak farklı geliştirme felsefelerinden ve dönemlerinden kaynaklanmaktadırlar.

YOLO11 Detayları:
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolo11/

YOLO11 hakkında daha fazla bilgi edinin

YOLOv7 Detayları:
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/

YOLOv7 hakkında daha fazla bilgi edinin.

Mimari Farklılıklar

İç mekanizmaları analiz edildiğinde, her iki dedektör de son teknoloji kavramları kullanır, ancak yapısal temelleri farklılık gösterir.

YOLOv7, Genişletilmiş Verimli Katman Birleştirme Ağları (E-ELAN) konseptini tanıttı. Bu mimari, orijinal gradyan yolunu bozmadan ağın öğrenme yeteneğini sürekli olarak geliştirmek için tasarlanmıştır; bu, araştırma makalelerinde bildirilen önemli bir gelişmedir. YOLOv7, eğitim sırasında yapısal yeniden parametrelendirmeye ve sağlam bir "bedava ekstralar" metodolojisine büyük ölçüde güvenerek, çıkarım maliyetlerini artırmadan COCO veri kümesindeki genel doğruluğu artırır.

Buna karşılık, YOLO11 yüksek düzeyde optimize edilmiş Ultralytics mimarisi üzerine inşa edilmiştir. Daha az parametreyle daha rafine bir özellik çıkarımı hattına odaklanarak eğitim sırasında daha düşük bellek kullanımına yol açar. YOLO11, daha az hesaplama kaynağı (FLOPs) kullanarak daha ağır modellerin algılama doğruluğunu yakalarken veya aşarken oldukça uygun bir performans dengesi sağlar. Ayrıca, YOLO11 doğal olarak daha geniş bir görev yelpazesini destekleyerek modern bilgisayar görüşü uygulamaları için oldukça çok yönlü bir seçim haline gelir.

Bellek Verimliliği

Ultralytics YOLO modellerinin öne çıkan özelliklerinden biri, diğer son teknoloji modellere kıyasla eğitim sırasında daha düşük bellek gereksinimleridir; bu da geliştiricilerin tüketici sınıfı PyTorch donanımında güçlü ağlar eğitmesine olanak tanır.

Performans ve Metrik Karşılaştırması

Gerçek dünya uygulanabilirliğini doğru bir şekilde ölçmek için ortalama Hassasiyet (mAP), çıkarım hızı, model parametreleri ve hesaplama karmaşıklığı (FLOPs) gibi metrikleri değerlendirmek çok önemlidir. Aşağıdaki tablo, YOLO11 ölçeklendirme varyantlarının daha büyük YOLOv7 modelleriyle nasıl karşılaştırıldığını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Gözlemlendiği gibi, YOLO11x gibi bir model, YOLOv7x'in 53.1 mAP değerine kıyasla daha yüksek bir 54.7 mAP elde ederken, önemli ölçüde daha az parametre (56.9M'ye karşı 71.3M) kullanır. Bu, YOLO11'in üstün mimari verimliliğini vurgulamaktadır.

Eğitim Verimliliği ve Ekosistem Kullanılabilirliği

Bu iki mimariyi ayıran en belirleyici özelliklerden biri, geliştirici deneyimi ve çevreleyen ekosistemdir.

YOLOv7 temel olarak akademik bir araştırma deposudur. Modelleri eğitmek genellikle karmaşık ortam kurulumları, bağımlılıkların manuel olarak yönetilmesi ve uzun komut satırı argümanlarının kullanılmasını gerektirir. En son deneyleri desteklese de, YOLOv7 GitHub deposu kodunu özel üretim ortamlarına uyarlamak zaman alıcı olabilir.

YOLO11 kullanım kolaylığını tamamen yeniden tanımlıyor. Kesintisiz uçtan uca iş akışları sunan kapsamlı ve iyi yönetilen bir ekosistem olan Ultralytics Platformu'na tamamen entegredir. Veri etiketlemeden yerel eğitime ve dağıtıma kadar, birleşik Python API'si ve basit komut satırı arayüzü tüm süreci kolaylaştırır.

Kod Karşılaştırması

YOLO11 ile bir nesne algılama modeli eğitmek yalnızca birkaç satır kod gerektirir ve giriş engelini önemli ölçüde azaltır:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Quickly export to ONNX format
model.export(format="onnx")

Buna karşılık, tipik bir YOLOv7 eğitim komutu, yolların, yapılandırma dosyalarının ve bash betiklerinin dikkatli bir şekilde kurulmasını gerektiren şu şekildedir:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

YOLO11 ayrıca muazzam bir çok yönlülük sunar. YOLOv7, algılama dışındaki görevleri (poz veya segmentasyon gibi) desteklemek için tamamen farklı kod tabanları veya ağır değişiklikler gerektirirken, YOLO11 nesne algılama, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamayı tek, tutarlı bir çerçeve aracılığıyla ele alır.

Kolaylaştırılmış Dışa Aktarma

YOLO11'i TensorRT veya OpenVINO gibi formatlara dışa aktarmak yalnızca tek bir komut gerektirir ve eski modellerle karşılaşılan tipik operatör destek sorunlarını azaltır.

Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları

YOLOv7 ve YOLO11 arasında seçim yapmak tamamen proje kapsamına ve dağıtım kısıtlamalarına bağlıdır.

YOLOv7 ne zaman düşünülmeli:

  • Eski Modelleri Kıyaslama: Gradyan yolu tasarımlarını araştıran akademik araştırmacılar, daha yeni evrişimsel sinir ağlarını değerlendirmek için YOLOv7'yi bir temel olarak kullanabilirler.
  • Mevcut Özel İş Hatları: YOLOv7'nin benzersiz sınırlayıcı kutu kod çözme mantığı etrafında özel olarak oluşturulmuş, yoğun şekilde özelleştirilmiş C++ veya CUDA iş hatlarına sahip ekipler.

YOLO11 ne zaman seçilmeli:

  • Ticari Üretim: Akıllı perakende veya sağlık teşhisi uygulamaları, YOLO11'in bakımlı kod tabanı ve yüksek kararlılığından büyük ölçüde faydalanır.
  • Kaynak Kısıtlı Ortamlar: YOLO11n'in hafif ayak izi, ONNX aracılığıyla mobil ve uç cihazlara dağıtım için onu son derece uygun hale getirir.
  • Çok Görevli Projeler: Tek bir uygulamanın bir kişiyi tanımlaması, iskeletini (pozunu) haritalaması ve tuttukları bir nesneyi segmentlere ayırması gerekiyorsa, YOLO11 birleşik bir çözüm sunar.

En Son Teknoloji: YOLO26 ile İlerlemek

YOLO11 oldukça sağlam bir seçenek olsa da, yapay zekadaki yenilikler asla durmaz. Bugün yeni projelere başlayan mühendisler için Ultralytics YOLO26'yı keşfetmeleri şiddetle tavsiye edilir.

Ocak 2026'da piyasaya sürülen YOLO26, Maksimum Olmayan Bastırma sonrası işlemle ilişkili gecikme darboğazlarını tamamen ortadan kaldıran uçtan uca NMS-Free Tasarımını sunar. Ayrıca, YOLO26, daha hızlı yakınsama sağlamak için LLM eğitim metodolojilerinden ilham alan devrim niteliğindeki MuSGD Optimizer'ı içerir. ProgLoss + STAL aracılığıyla hedeflenen kayıp iyileştirmeleri ve DFL kaldırma sayesinde %43'e kadar daha hızlı CPU çıkarımı ile YOLO26, özellikle uç bilişim için optimize edilmiştir ve vizyon yapay zekasının mevcut zirvesini temsil etmektedir.

YOLO26 hakkında daha fazla bilgi edinin

Özel alternatif yapılarla ilgilenen kullanıcılar için, transformatör tabanlı RT-DETR veya dinamik açık kelime dağarcığına sahip YOLO-World modellerini keşfetmek de çeşitli bilgisayar görüşü dağıtımları için faydalı sonuçlar verebilir.


Yorumlar