İçeriğe geç

YOLOv7'ye Karşı YOLO11: Kapsamlı Bir Teknik Karşılaştırma

Bilgisayar görüşü alanı son birkaç yılda hızla gelişti. Doğru nesne algılama çerçevesini seçen geliştiriciler ve araştırmacılar için, nesil belirleyici modeller arasındaki mimari ve pratik farklılıkları anlamak kritik öneme sahiptir. Bu kılavuz, YOLOv7'nin akademik atılımı ile yüksek düzeyde geliştirilmiş, üretime hazır Ultralytics YOLO11 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır.

Model Kökenleri ve Mimari Felsefeler

YOLOv7, 6 Temmuz 2022'de Academia Sinica Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından yayınlandı ve alana birçok yeni konsept tanıttı. arXiv'de yayınlanan YOLOv7 araştırma makalelerinde ayrıntılı olarak açıklandığı üzere, model büyük ölçüde "eğitilebilir bedelsizler çantası" yaklaşımına ve Genişletilmiş Verimli Katman Toplama Ağlarına (E-ELAN) odaklanmaktadır. Bu mimari seçimler, gradyan yolu verimliliğini en üst düzeye çıkarmak için özel olarak tasarlanmıştır ve bu da onu üst düzey GPU'larda akademik kıyaslama için güçlü bir araç haline getirmektedir.

YOLOv7 hakkında daha fazla bilgi edinin.

YOLO11, Ultralytics'te Glenn Jocher ve Jing Qiu tarafından geliştirildi ve 27 Eylül 2024'te yayınlandı. YOLO11, saf mimari karmaşıklıktan bütünsel, geliştirici odaklı bir ekosisteme odaklanmayı kaydırır. Ultralytics GitHub deposunda barındırılan YOLO11, hem eğitim hem de çıkarım sırasında bellek tüketimini önemli ölçüde azaltan optimize edilmiş, ankorsuz bir tasarıma sahiptir. Veri kümesi açıklamasından uç dağıtıma kadar eşsiz bir kullanım kolaylığı sunarak Ultralytics Platformu'na yerel olarak entegre edilmiştir.

YOLO11 hakkında daha fazla bilgi edinin

Ekosistem Avantajı

Bağımsız depolar genellikle akademik bir makale yayınlandıktan sonra pasif hale gelirken, Ultralytics modelleri sürekli güncellemelerden faydalanır ve en son PyTorch sürümleri ve özel donanım hızlandırıcıları gibi modern makine öğrenimi yığınlarıyla uzun vadeli uyumluluk sağlar.

Performans Metrikleri ve Verimlilik

Modelleri gerçek dünya uygulamalarına dağıtırken, ham doğruluk çıkarım hızı ve hesaplama yükü ile dengelenmelidir. Aşağıda, standart COCO veri kümesi kıyaslamalarında değerlendirilen YOLOv7 ve YOLO11 varyantlarının doğrudan karşılaştırması yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Not: YOLOv7 için eksik CPU hızları, ONNX CPU kıyaslamalarını standartlaştırmayan eski test ortamlarını göstermektedir. Karşılaştırılabilir katmanlardaki en iyi değerler vurgulanmıştır.

Sonuçları Analiz Etme

Veriler, verimlilikte net bir evrimi göstermektedir. YOLO11l (Büyük) modeli, YOLOv7l'nin %51,4'üne kıyasla %53,4'lük üstün bir mAPval elde etmektedir; bunu yaparken önemli ölçüde daha az parametre (25,3M'ye karşı 36,9M) ve çok daha az FLOP (86,9B'ye karşı 104,7B) kullanır. Hesaplama karmaşıklığındaki bu azalma, YOLO11'in NVIDIA TensorRT uygulamalarında daha hızlı çalışmasını sağlar ve daha az VRAM gerektirir, bu da onu donanım kısıtlı ortamlar için çok daha uygun hale getirir.

Kullanılabilirlik ve Eğitim İş Akışları

İki çerçeve arasındaki önemli bir farklılık noktası, geliştirici deneyimidir.

YOLOv7 Eğitimi

Orijinal YOLOv7 açık kaynak kod tabanını kullanmak genellikle depoyu klonlamayı, bağımlılıkları manuel olarak çözmeyi ve ayrıntılı komut satırı argümanlarına güvenmeyi gerektirir.

YOLO11 Eğitimi

YOLO11, şuraya derinden entegre edilmiştir: ultralytics python paketi, makine öğrenimi yaşam döngüsünü basitleştirir. Bir nesne algılama modeli yalnızca birkaç satır kod gerektirir ve çerçeve, veri indirme, hiperparametre ayarlama ve önbelleğe almayı yerel olarak yönetir.

from ultralytics import YOLO

# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")

Ayrıca, YOLO11 aşırı çok yönlülük sunar. Model son ekini değiştirerek, geliştiriciler anında detect'ten örnek segmentasyon eşlemesine, poz tahmini track'e veya Yönlendirilmiş Sınırlayıcı Kutu (obb) tanımaya geçiş yapabilirler—YOLOv7'nin sahip olmadığı yerel çoklu görev desteği seviyesi.

Basitleştirilmiş Dışa Aktarımlar

YOLO11'i şunun gibi uç formatlara dışa aktarmak: Apple CoreML veya Intel OpenVINO çerçeveleri yalnızca tek bir .export() komut gerektirir, eski nesil modellerin sıklıkla gerektirdiği karmaşık grafik-cerrahisini önleyerek.

İdeal Dağıtım Senaryoları

Her modelin güçlü yönlerini anlamak, en iyi kullanım senaryolarını belirlemeye yardımcı olur.

  • Eski Benchmark Yeniden Üretimi: YOLOv7, belirli 2022 benchmarklarını yeniden üretmesi veya yeniden parametrelendirme tekniklerinin çapa tabanlı ağlar üzerindeki etkilerini incelemesi gereken akademik araştırmacılar için faydalı olmaya devam etmektedir.
  • Ticari Üretim Ortamları: YOLO11, kurumsal sistemler için açık bir tercihtir. Kararlılığı, aktif bakımı ve bulut tabanlı Ultralytics Platform arayüzü ile entegrasyonu, onu büyük ölçekli perakende analizi, güvenlik izleme ve üretim kalite kontrolünü yönetmek için ideal kılar.
  • Kaynak Kısıtlı Uç Bilişim: İnanılmaz derecede hafif YOLO11n varyantı, düşük güçlü uç cihazlar için özel olarak tasarlanmıştır ve bir Raspberry Pi sistemi veya NVIDIA Jetson modülleri üzerinde verimli bir şekilde çalışır.

İleriye Bakış: YOLO26'nın Paradigma Değişimi

YOLO11 son derece rafine, son teknoloji bir çözümü temsil etse de, makine öğrenimi alanı durmaksızın ilerlemektedir. Bugün yepyeni görüntü işleme projelerine başlayan kullanıcılar için, yeni piyasaya sürülen Ultralytics YOLO26'yı keşfetmeleri şiddetle tavsiye edilir.

Ocak 2026'da piyasaya sürülen YOLO26, hem YOLOv7'yi hem de YOLO11'i geride bırakan birçok çığır açan özellik sunmaktadır:

  • Yerel NMS-Serbest Mimari: YOLO26, Non-Maximum Suppression (NMS) son işlemine olan ihtiyacı ortadan kaldırır. Bu uçtan uca tasarım, dağıtım hatlarını basitleştirir ve gecikme değişkenliğini önemli ölçüde azaltır.
  • Yüzde 43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) modülünü stratejik olarak kaldırarak, YOLO26 uç cihazlar ve özel GPU'ları olmayan ortamlar için yoğun bir şekilde optimize edilmiştir.
  • MuSGD Optimizasyon Entegrasyonu: Moonshot AI'dan gelişmiş LLM eğitim tekniklerinden esinlenerek, bu hibrit optimize edici, eşi benzeri görülmemiş eğitim kararlılığı ve daha hızlı yakınsama oranları sağlar.
  • Üstün Küçük Nesne Algılama: ProgLoss ve STAL kayıp fonksiyonlarının tanıtılması, küçük detayları tanımlamak için kritik doğruluk artışları sağlar; bu da drone hava görüntülerini ve karmaşık IoT sensör verilerini analiz etmek için mükemmeldir.

YOLO26 hakkında daha fazla bilgi edinin

Transformatör tabanlı mimarilere veya alternatif paradigmalara ilgi duyan kullanıcılar için, Ultralytics belgeleri ayrıca RT-DETR transformatör dedektörü ve YOLO-World açık kelime modeli gibi modelleri de kapsar.


Yorumlar