İçeriğe geç

YOLOv7 ve YOLO26: Gerçek Zamanlı Nesne Algılamanın Evrimi

Bilgisayar görüşü alanı hızla gelişmekte olup, her yeni model nesli gerçek zamanlı analizde mümkün olanın sınırlarını zorlamaktadır. Bu kapsamlı karşılaştırma, eski YOLOv7 ile son teknoloji YOLO26 arasındaki farkları, mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını analiz etmektedir. YOLOv7 2022'de önemli bir kilometre taşını temsil ederken, YOLO26 uçtan uca işleme ve Büyük Dil Modeli (LLM) eğitiminden türetilen optimizasyon stratejileri gibi çığır açan yenilikler sunmaktadır.

Modele Genel Bakış

YOLOv7

Temmuz 2022'de piyasaya sürülen YOLOv7, çıkarım maliyetlerini artırmadan doğruluğu iyileştirmek için eğitim sürecini optimize eden "eğitilebilir bedelsizler çantası" kavramını tanıttı. Extended Efficient Layer Aggregation Networks (E-ELAN) ve model ölçeklendirme teknikleri gibi mimari reformlara yoğun bir şekilde odaklandı.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7

Ultralytics YOLO26

2026'nın başlarında piyasaya sürülen YOLO26, YOLO soyunda bir paradigma değişimini temsil etmektedir. Kenar cihazlarda maksimum verimlilik ve kolaylaştırılmış dağıtım için tasarlanmıştır. Temel yenilikler arasında karmaşık ön işleme ihtiyacını ortadan kaldıran yerel uçtan uca NMS içermeyen tasarım ve dışa aktarılabilirliği basitleştirmek için Distribution Focal Loss (DFL)'nin kaldırılması yer almaktadır.

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2026-01-14
Belgeler:Ultralytics YOLO26
GitHub:ultralytics/ultralytics

YOLO26 hakkında daha fazla bilgi edinin

Teknik Karşılaştırma

Aşağıdaki tablo, YOLOv7'den YOLO26'ya olan performans sıçramasını vurgulamaktadır. YOLOv7 kendi zamanında kıyaslamalar belirlerken, YOLO26 özellikle CPU tabanlı çıkarım için üstün hız ve verimlilik sunar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Performans Analizi

YOLO26l, çok daha ağır YOLOv7x'in doğruluğunu (55.0'e karşı 53.1 mAP) önemli ölçüde daha az parametre (24.8M'ye karşı 71.3M) ve FLOP (86.4B'ye karşı 189.9B) kullanarak aşmaktadır. Bu verimlilik, YOLO26'yı model optimizasyonunun kritik olduğu kaynak kısıtlı ortamlar için ideal kılar.

Mimari Farklılıklar

YOLOv7 Mimarisi

YOLOv7'nin mimarisi, en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikler öğrenmesini sağlayan E-ELAN (Extended Efficient Layer Aggregation Network)'a dayanmaktadır. Ayrıca, birleştirme tabanlı modeller için model ölçeklendirme kullanır, ağın derinliğini ve genişliğini eş zamanlı olarak ayarlar. Ancak, YOLOv7 hala çapa tabanlı algılama başlıklarına dayanır ve yinelenen sınırlayıcı kutuları filtrelemek için ön işleme sonrası sırasında Non-Maximum Suppression (NMS) gerektirir. Bu NMS adımı, dağıtımda bir darboğaz olabilir ve genellikle TensorRT veya CoreML gibi farklı donanım arka uçları için özel uygulama gerektirir.

YOLO26 Mimarisi

YOLO26, kullanıcı deneyimini basitleştirmek ve performansı artırmak için tasarlanmış birkaç radikal değişiklik sunar:

  • Uçtan Uca NMS-Siz: Yerel bir uçtan uca mimariyi (YOLOv10'da öncülük edilen) benimseyerek, YOLO26 NMS ihtiyacını ortadan kaldırır. Model, nihai detect'leri doğrudan çıkarır, bu da gecikmeyi azaltır ve dağıtım hatlarını önemli ölçüde basitleştirir.
  • DFL Kaldırma: Distribution Focal Loss'un kaldırılması, çıktı başlığını kolaylaştırarak modeli kenar cihazlarla ve INT8 gibi düşük hassasiyetli formatlarla daha uyumlu hale getirir.
  • MuSGD Optimizatörü: Moonshot AI'nin Kimi K2 gibi Büyük Dil Modelleri (LLM'ler) eğitimindeki yeniliklerden ilham alan YOLO26, hibrit bir MuSGD optimizatörü kullanır. Bu, SGD'nin momentumunu Muon optimizatörünün adaptif özellikleriyle birleştirerek daha istikrarlı eğitim ve daha hızlı yakınsama sağlar.
  • Küçük Nesne Optimizasyonu: Aşamalı Kayıp Dengeleme (ProgLoss) ve Küçük Hedefe Duyarlı Etiket Ataması (STAL)'nın entegrasyonu, küçük nesneleri detect etmede karşılaşılan yaygın zorlukları doğrudan ele alarak YOLO26'yı hava görüntüleme ve IoT uygulamaları için özellikle etkili kılar.

Eğitim ve Kullanılabilirlik

Kullanım Kolaylığı

...'nın ayırt edici özelliklerinden biri Ultralytics ekosistemi erişilebilirliktir. YOLOv7 belirli bir depoyu klonlamayı ve karmaşık yapılandırma dosyalarını yönetmeyi gerektirirken, YOLO26 doğrudan şuraya entegre edilmiştir: ultralytics Python paketi. Bu, eğitim, doğrulama ve dağıtım için birleşik bir API sağlar.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single line of code
results = model.train(data="coco8.yaml", epochs=100)

Çok Yönlülük

YOLOv7 öncelikli olarak nesne detect'i ve poz tahmini üzerine odaklanır. Buna karşılık, YOLO26 aşağıdakiler dahil olmak üzere daha geniş bir bilgisayar görüşü görevleri dizisini destekleyen birleşik bir çerçeve sunar:

  • Örnek Segmentasyon: Hassas maskeleme için özel kayıplarla.
  • Poz Tahmini: Doğru anahtar noktalar için Artık Log-Olasılık Tahmini (RLE) kullanarak.
  • Yönlendirilmiş Sınırlayıcı Kutular (OBB): Döndürülmüş nesneler için özel açı kaybı içerir.
  • Sınıflandırma: Verimli görüntü kategorizasyonu için.

Eğitim Verimliliği

YOLO26'nın eğitim süreci yüksek oranda optimize edilmiştir. MuSGD optimizatörü daha hızlı yakınsama sağlar, bu da kullanıcıların eski optimizatörlere kıyasla genellikle daha az epokta daha iyi sonuçlar elde edebileceği anlamına gelir. Ayrıca, YOLO26 modellerinin daha düşük bellek ayak izi, aynı donanım üzerinde daha büyük toplu iş boyutlarına olanak tanıyarak eğitim döngüsünü daha da hızlandırır. Bu, genellikle önemli miktarda CUDA belleği gerektiren transformatör tabanlı modellere göre önemli bir avantajdır.

Gerçek Dünya Uygulamaları

YOLOv7'nin Üstün Olduğu Alanlar

YOLOv7, ELAN ağlarının belirli mimari özellikleriyle ilgilenen araştırmacılar veya Darknet tarzı mimari etrafında inşa edilmiş eski sistemleri sürdürenler için yetenekli bir model olmaya devam etmektedir. Akademik karşılaştırma için mükemmel bir kıyaslama noktası olarak hizmet eder.

YOLO26'nın Üstün Olduğu Alanlar

YOLO26, performans dengesi ve dağıtım kolaylığı nedeniyle çoğu modern uygulama için önerilen seçimdir:

  • Kenar Bilişim: %43'e kadar daha hızlı CPU çıkarımı ile YOLO26, Raspberry Pi, mobil cihazlar veya özel GPU'ları olmayan yerel sunucularda çalıştırmak için mükemmeldir.
  • Robotik ve Otonom Sistemler: Uçtan uca tasarım, robotikte gerçek zamanlı karar verme için kritik olan gecikme değişkenliğini azaltır. Geliştirilmiş küçük nesne detect'i (STAL aracılığıyla) navigasyon ve engellerden kaçınmaya yardımcı olur.
  • Ticari Dağıtım: NMS ve DFL'nin kaldırılması, ONNX, TensorRT ve CoreML gibi formatlara dışa aktarma sürecini basitleştirerek farklı dağıtım ortamlarında tutarlı davranış sağlar.
  • Tarımsal İzleme: Küçük nesne detect'inde yüksek hassasiyet, YOLO26'yı drone görüntülerinden zararlıları tanımlama veya mahsulleri sayma gibi görevler için mükemmel kılar.

YOLOv7'den Geçiş

YOLOv7'den YOLO26'ya geçiş yapan kullanıcılar, Ultralytics API sayesinde geçişi sorunsuz bulacaktır. Hız ve dışa aktarım kolaylığındaki büyük iyileştirmeler, genellikle üretim sistemleri için yükseltmeyi haklı çıkarır. Diğer modern alternatifleri arayanlar için YOLO11, Ultralytics ekosistemi tarafından tam olarak desteklenen başka bir sağlam seçenektir.

Sonuç

YOLOv7 açık kaynak topluluğuna önemli bir katkı olsa da, YOLO26 verimli bilgisayar görüşünün geleceğini temsil etmektedir. NMS gibi kritik darboğazları ele alarak ve LLM dünyasından modern optimizasyon tekniklerini kullanarak, YOLO26 yalnızca daha hızlı ve daha hafif olmakla kalmayıp aynı zamanda eğitilmesi ve dağıtılması önemli ölçüde daha kolay olan bir model sunar.

Güvenilir, iyi bakımlı ve çok yönlü bir çözüm arayan geliştiriciler için YOLO26 üstün bir seçimdir. Ultralytics ekosistemine entegrasyonu, sürekli güncellemelere, kapsamlı belgelere ve gelişen bir destek topluluğuna erişim sağlar.

YOLO26 hakkında daha fazla bilgi edinin


Yorumlar