İçeriğe geç

YOLO11 YOLOv7: Mimari ve Performansın Teknik Karşılaştırması

Bilgisayar görme alanı hızla gelişirken, doğru nesne algılama mimarisini seçmek başarı için kritik öneme sahip hale geliyor. YOLO iki önemli rakibi şunlardır YOLO11, Ultralytics tarafından geliştirilen ve YOLOv7, Academia Sinica'nın araştırma odaklı modelidir. Her iki model de son teknolojiye önemli katkılar sağlamış olsa da, hız, esneklik ve dağıtım kolaylığı açısından farklı ihtiyaçları karşılamaktadır.

Bu kılavuz, geliştiricilerin ve araştırmacıların projelerine en uygun aracı seçmelerine yardımcı olmak için mimarileri, performans ölçütleri ve ideal kullanım örnekleri hakkında derinlemesine teknik analizler sunar.

Modele Genel Bakış ve Kökenleri

Bu modellerin soyunu anlamak, mimari kararlarının bağlamını anlamamızı sağlar.

YOLO11

Eylül 2024'te yayınlandı Ultralyticstarafından piyasaya sürülen YOLO11 , şirketin üretim odaklı felsefesinin bir gelişmiş versiyonunu YOLO11 . Modern donanımlarda verimliliği en üst düzeye çıkarmak için tasarlanan bu ürün, yüksek verim ile rekabetçi doğruluk arasında denge kuruyor.

  • Yazarlar: Glenn Jocher ve Jing Qiu
  • Kuruluş:Ultralytics
  • Tarih: Eylül 2024
  • Ana Odak Noktası: Gerçek zamanlı kullanım kolaylığı, geniş görev desteği (algılama, segmentasyon, poz, OBB, sınıflandırma) ve Ultralytics aracılığıyla kolaylaştırılmış dağıtım.

YOLO11 hakkında daha fazla bilgi edinin

YOLOv7

Temmuz 2022'de piyasaya sürülen YOLOv7 , YOLOv4'ün arkasındaki ekip tarafından tanıtılan önemli bir akademik dönüm YOLOv7 . Tahmin maliyetini artırmadan doğruluğu artırmak için birkaç "bag-of-freebies" özelliği getirerek, eğitilebilir mimari optimizasyonlara yoğun bir şekilde odaklandı.

  • Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
  • Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica
  • Tarih: Temmuz 2022
  • Ana Odak Noktası: Gradyan yolu analizi, model yeniden parametreleştirme ve dinamik etiket atama.

YOLOv7 hakkında daha fazla bilgi edinin.

Performans Analizi

Bu mimarileri karşılaştırırken, Ortalama Hassasiyet (mAP) ve çıkarım gecikmesi gibi ölçütler çok önemlidir. Aşağıdaki tablo, YOLO11 yeni mühendisliğin eski YOLOv7 göre nasıl verimlilik artışı YOLO11 göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Temel Çıkarımlar

  • Verimlilik: YOLO11m modeli, standart YOLOv7 51,4%) biraz daha yüksek doğruluk (51,5% mAP) elde ederken, yaklaşık %45 daha az parametre (20,1 milyon karşı 36,9 milyon) ve önemli ölçüde daha az FLOP kullanır.
  • Hız: T4 GPU'larda, YOLO11 , otonom sürüş veya video analizi gibi gerçek zamanlı uygulamalar için kritik bir faktör olan çıkarım gecikmesinde YOLOv7 sürekli olarak daha iyi performans gösterir.
  • Ölçeklenebilirlik: YOLO11 , daha geniş bir model ölçeği yelpazesi (Nano'dan X-Large'a) YOLO11 , Raspberry Pi veya mobil cihazlar gibi kaynakları sınırlı donanımlarda daha kolay bir şekilde kullanılmasını sağlar.

Mimari Farklılıklar

Ultralytics YOLO11

YOLO11 , CSPNet (Cross-Stage Partial Network) backbone temel YOLO11 , ancak daha iyi gradyan akışı ve özellik çıkarma için blok tasarımını iyileştirir.

  • Geliştirilmiş Backbone: Hesaplamayı azaltırken özelliklerin yeniden kullanımını artıran, geliştirilmiş C3k2 bloğu (CSP darboğazlarının daha hızlı bir uygulaması) kullanır.
  • Anchor-Free Detection (Anchor-Free Algılama): Önceki sürümleri gibi, YOLO11 de anchor-free head ( anchor-free kafa) YOLO11 ve manuel anchor box kümeleme ihtiyacını ortadan kaldırarak eğitim sürecini basitleştirir.
  • Çoklu Görev Başlıkları: Mimari, nesne algılama, örnek segmentasyonu ve poz tahmini arasında sorunsuz geçişe olanak tanıyan, birleşik bir başlık yapısı kullanarak çoklu görevleri desteklemek üzere doğal olarak tasarlanmıştır.

YOLOv7

YOLOv7 , en kısa ve en uzun gradyan yollarını etkili bir şekilde kontrol etmek için "Genişletilmiş ELAN" (E-ELAN) özelliğini YOLOv7 .

  • E-ELAN: Ağın gradyan yolunu bozmadan daha çeşitli özellikleri öğrenmesini sağlamak için tasarlanmış bir hesaplama bloğu.
  • Model Yeniden Parametreleştirme: Yeniden parametreleştirme tekniklerini (RepConv) kullanarak, çıkarım sırasında ayrı konvolüsyon katmanlarını tek bir katmanda birleştirir ve eğitim doğruluğunu kaybetmeden hızı artırır.
  • Yardımcı Başlık Kaba-İnce: Modelin derinlemesine denetimine yardımcı olan, ancak eğitim sürecine karmaşıklık katan, eğitim denetimi için bir yardımcı başlık sunar.

YOLO26'ya Evrim

YOLO11 önemli iyileştirmeler YOLO11 , en son YOLO26 sınırları daha da zorluyor. Ocak 2026'da piyasaya sürülen YOLO26, uçtan uca NMS bir tasarıma sahip olup, sonradan işleme ihtiyacını ortadan kaldırıyor ve CPU %43'e kadar hızlandırıyor . Ayrıca, daha hızlı yakınsama için LLM eğitiminden esinlenen MuSGD Optimizer'ı kullanıyor .

Eğitim ve Kullanım Kolaylığı

Geliştiriciler için, bir modelin "kullanıcı deneyimi" —eğitilmesi, doğrulanması ve uygulanmasının ne kadar kolay olduğu— genellikle ham metrikler kadar önemlidir.

Ultralytics Ekosisteminin Avantajı

YOLO11 , Ultralytics Python tamamen entegre YOLO11 ve "sıfırdan kahramana" iş akışı sunar.

  1. Birleştirilmiş API: YOLO11, YOLOv8veya YOLO26 arasında geçiş yapabilirsiniz.
  2. Bellek Verimliliği: Ultralytics , birçok araştırma deposuna kıyasla eğitim sırasında daha az CUDA kullanacak şekilde optimize edilmiştir. Bu, tüketici GPU'larında daha büyük parti boyutlarına olanak tanır.
  3. Tek Tıkla Dışa Aktarma: ONNX, TensorRT, CoreML veya TFLite gibi formatlara dışa aktarma TFLite tek bir komut modu ile TFLite .
from ultralytics import YOLO

# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
path = model.export(format="onnx")

YOLOv7

YOLOv7 bağımsız bir depoya dayanır. Güçlü olmasına rağmen, genellikle şunları gerektirir:

  • Manuel yapılandırma .yaml ankrajlar için dosyalar (ankrajsız sürümü kullanmıyorsanız).
  • Dışa aktarımdan önce yeniden parametrelendirilmiş ağırlıkları birleştirmek için özel "dağıtım" komut dosyaları.
  • Eğitim sırasında yardımcı kafaları yönetmek için daha karmaşık komut satırı argümanları.

Gerçek Dünya Uygulamaları

Ne Zaman YOLO11 Seçmeli

YOLO11 güvenilirlik ve bakımın önemli olduğu ticari ve endüstriyel uygulamalar için tercih YOLO11 .

  • Edge AI: "Nano" ve "Small" modellerinin mevcudiyeti, YOLO11 akıllı kameralar ve üretim hatlarını izleyen IoT cihazları için YOLO11 getirir.
  • Çoklu Görev Projeleri: Uygulamanız nesneleri takip ederken aynı anda kilit noktaları tahmin etmeyi gerektiriyorsa (örneğin, spor analitiği), YOLO11 birleşik çerçevesi kod tabanını basitleştirir.
  • Hızlı Prototipleme: Kullanım kolaylığı, ekiplerin Ultralytics kullanarak özel veri kümeleri üzerinde hızlı bir şekilde yineleme yapmalarını sağlar ve pazara sunma süresini kısaltır.

YOLOv7 Ne Zaman Tercih Edilmeli?

  • Akademik Karşılaştırma: 2022-2023 literatüründeki sonuçları tekrarlıyorsanız veya E-ELAN mimarilerinin spesifik etkilerini inceliyorsanız.
  • Eski Sistemler: Orijinal Darknet tarzı YOLO belirli giriş/çıkış yapısına zaten derinlemesine entegre edilmiş sistemler için.

Sonuç

YOLOv7 YOLOv7 nesne algılama tarihinde saygın bir dönüm noktası olmaya devam ederken, YOLO11 daha modern, verimli ve geliştirici dostu bir çözüm sunar. Üstün hız-doğruluk oranları, daha düşük bellek gereksinimleri ve sağlam Ultralytics desteği ile YOLO11 , gerçek dünya uygulamaları için daha net bir yol YOLO11 .

En son teknolojiyi arayanlar için, YOLO26'yi incelemenizi öneririzNMS

Ek Kaynaklar


Yorumlar