YOLOv10 ve YOLOv7: Gerçek Zamanlı Nesne Algılamanın Evrimi

Bilgisayarlı görü alanında son birkaç yılda yaşanan hızlı ilerleme, gerçek zamanlı uygulamalar için giderek daha verimli mimariler ortaya çıkardı. YOLOv10 ve YOLOv7 modellerini karşılaştırmak, bu evrimdeki kritik bir geçiş dönemine ışık tutuyor. YOLOv7 oldukça etkili eğitim stratejileri ve mimari ölçeklendirme getirirken, YOLOv10 uzun süredir devam eden NMS bağımlılığını ortadan kaldırarak dağıtımda devrim yarattı.

Her iki model de kendi piyasaya sürülüş zamanlarında nesne algılama sınırlarını zorladı, ancak modern Ultralytics ekosistemi ve YOLO26 gibi yeni nesil modellerin tanıtılması, günümüzün yapay zeka uygulayıcıları için çok daha üstün iş akışları sunuyor.

Model Profilleri ve Kökenleri

Bu modellerin kökenlerini anlamak, mimari tasarım tercihleri ve onları yönlendiren akademik araştırmalar hakkında değerli bir bağlam sağlar.

YOLOv10 Detayları

YOLOv10 hakkında daha fazla bilgi edinin

YOLOv7 Detayları

YOLOv7 hakkında daha fazla bilgi edinin

Mimari Yenilikler

YOLOv7 Yaklaşımı

2022'de piyasaya sürülen YOLOv7, büyük ölçüde gradyan yollarını optimize etmeye odaklandı. Modelin, orijinal gradyan yolunu bozmadan daha çeşitli özellikleri öğrenmesini sağlayan Genişletilmiş Verimli Katman Toplama Ağını (E-ELAN) tanıttı. Ayrıca yazarlar, eğitim sırasında hızlı yürütme hızlarını korumak için çıkarım sırasında birleştirilebilen yeniden parametreleştirme tekniklerinden yararlanan bir "trainable bag-of-freebies" metodolojisi uyguladılar. Bu etkileyici optimizasyonlara rağmen, YOLOv7 yine de işlem sonrası (post-processing) için büyük ölçüde NMS'ye güveniyordu ve bu da yoğun sahne analizleri sırasında değişken gecikmelere yol açıyordu.

YOLOv10 Atılımı

YOLOv10, NMS darboğazını doğrudan ele aldı. Eğitim sırasında tutarlı ikili atamalar getirerek, Tsinghua Üniversitesi ekibi NMS'siz uçtan uca algılamayı mümkün kıldı. Bu çift başlı yaklaşım, eğitim sırasında zengin denetim sinyalleri için bire-çok atamalı bir dal ve NMS'siz çıkarım için bire-bir atamalı başka bir dal kullanır. Bu mimari değişiklik, yüksek hızlı video analitiği için uygun, tutarlı ve ultra düşük inference latency sağlar. Ayrıca YOLOv10, önceki nesillerde bulunan hesaplama fazlalıklarını ortadan kaldıran, bütünsel bir verimlilik-doğruluk odaklı model tasarımı kullanır.

İşlem Sonrası (Post-Processing) Etkisi

NMS işlem sonrası adımı kaldırmak, yalnızca çıkarımı hızlandırmakla kalmaz, aynı zamanda özel NMS işlemlerinin derlenmesinin zor olduğu yapay zeka hızlandırıcıları ve NPU'lar gibi uç yapay zeka donanımlarında dağıtımı önemli ölçüde basitleştirir.

Performans Karşılaştırması

MS COCO dataset üzerindeki ham metrikleri karşılaştırırken, nesiller arası fark belirgin hale gelir. YOLOv10, parametreler, hesaplama gereksinimleri ve doğruluk arasında çok daha avantajlı bir denge sağlar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Yukarıda görüldüğü gibi, YOLOv10x, yaklaşık %20 daha az parametre kullanırken YOLOv7x'in %53,1'lik mAP değerine kıyasla %54,4'lük daha üstün bir mAP sağlar. Ayrıca, hafif YOLOv10 modelleri (Nano ve Small) olağanüstü TensorRT deployment hızları sunarak mobil dağıtımlar için oldukça cazip hale gelir.

Ultralytics Ekosistem Avantajı

Mimari makaleleri incelemek öğretici olsa da, modern bilgisayarlı görü geliştirme süreci sağlam ve iyi yönetilen çerçevelere dayanır. Ultralytics destekli bir model seçmek, prototipten üretime hızla geçmek isteyen geliştiriciler için büyük bir avantaj sağlar.

Kolaylaştırılmış Geliştirme

Hem YOLOv10 hem de YOLOv7, standart Ultralytics Python paketi aracılığıyla erişilebilir. Bu, binlerce satırlık standart kodu basit ve sezgisel bir API ile değiştirerek benzersiz bir Kullanım Kolaylığı sağlar. Ayrıca, Ultralytics YOLO modelleri, eğitim sırasında ağır transformer mimarilerine kıyasla önemli ölçüde daha düşük CUDA belleği gerektirir ve bu da tüketici sınıfı donanımlarda daha büyük yığın boyutlarının (batch size) kullanılmasına olanak tanır.

Eşsiz Çok Yönlülük

Eski depolar genellikle sadece sınırlayıcı kutu (bounding box) algılamaya odaklanırken, entegre Ultralytics çerçevesi çok çeşitli görevleri sorunsuz bir şekilde destekler. Instance Segmentation, Pose Estimation veya Oriented Bounding Box (OBB) algılaması yapıyor olsanız da, iş akışı aynı kalır.

Kod Örneği: Tutarlı Eğitim İş Akışları

data augmentation ve öğrenme oranı zamanlamasını otomatik olarak yöneten sorunsuz eğitim sürecini gösteren kod parçacığı aşağıdadır:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

Kullanım Durumları ve Öneriler

YOLOv10 ve YOLOv7 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman YOLOv10 Seçilmeli

YOLOv10 şunlar için güçlü bir seçimdir:

  • NMS-Free Gerçek Zamanlı Algılama: Non-Maximum Suppression olmadan uçtan uca algılamadan faydalanan, dağıtım karmaşıklığını azaltan uygulamalar.
  • Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile algılama doğruluğu arasında güçlü bir denge gerektiren projeler.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

Ne Zaman YOLOv7 Seçilmeli

YOLOv7 şunlar için önerilir:

  • Akademik Kıyaslama: 2022 dönemi en iyi sonuçlarını yeniden üretmek veya E-ELAN ve trainable bag-of-freebies tekniklerinin etkilerini incelemek.
  • Yeniden Parametrelendirme Araştırması: Planlanmış yeniden parametrelendirilmiş konvolüsyonları ve bileşik model ölçeklendirme stratejilerini araştırmak.
  • Mevcut Özel Hatlar: Kolayca yeniden düzenlenemeyen, YOLOv7'nin özel mimarisi üzerine kurulu yoğun özelleştirilmiş hatlara sahip projeler.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Yeni Standart: YOLO26 ile Tanışın

YOLOv10 2024'te büyük bir sıçrama olsa da, bilgisayarlı görü ortamı inanılmaz hızlı hareket ediyor. Tüm yeni geliştirmeler için en son nesil modeli şiddetle öneriyoruz: Ultralytics YOLO26. Ocak 2026'da piyasaya sürülen bu model, hem YOLOv7 hem de YOLOv10'un yerini büyük ölçüde alan, gerçek zamanlı yapay zeka görü teknolojisinin zirvesini temsil eder.

YOLO26 hakkında daha fazla bilgi edin

YOLO26, özellikle modern dağıtım ortamları için tasarlanmış benzeri görülmemiş yenilikler getiriyor:

  • Uçtan Uca NMS'siz Tasarım: YOLOv10 tarafından atılan temelin üzerine inşa edilen YOLO26, daha basit dağıtım hatları ve tutarlı yüksek hızlı çıkarım için NMS işlem sonrasını yerel olarak ortadan kaldırır.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Uç bilgi işlem ve özel GPU'lardan yoksun cihazlar için ağır bir şekilde optimize edilmiş olup donanım maliyetlerinde büyük tasarruf sağlar.
  • DFL Kaldırma: Distribution Focal Loss tamamen kaldırıldı, bu da dışa aktarma mantığını kökten basitleştiriyor ve düşük güçlü uç cihazlar ile mikrodenetleyicilerle uyumluluğu önemli ölçüde artırıyor.
  • MuSGD Optimizer: Moonshot AI'ın Kimi K2 modelinden esinlenen bu SGD ve Muon melezi, Large Language Model (LLM) eğitim yeniliklerini doğrudan bilgisayarlı görü alanına taşıyarak inanılmaz derecede kararlı eğitim dinamikleri ve daha hızlı yakınsama sağlar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, dronlar, robotik ve smart city monitoring için kritik olan küçük nesne tanıma konusunda tarihsel olarak zorlu bir alanda kayda değer iyileştirmeler sağlar.
  • Göreve Özel İyileştirmeler: YOLO26 sadece bir algılayıcı değildir. Özel semantik bölütleme kaybı, ultra hassas poz takibi için Kalıntı Log-Olabilirlik Tahmini (RLE) ve OBB sınır sorunlarını ortadan kaldırmak için özel açı kaybı algoritmalarını içerir.
Veri Kümelerini Yönetme ve Eğitim

Veri kümelerinizi yönetmek, YOLO26'yı eğitmek ve modelleri buluta dağıtmak konusunda mutlak en iyi deneyim için Ultralytics Platform'u keşfedin. Python SDK'sını mükemmel bir şekilde tamamlayan kodsuz bir arayüz sunar.

Gerçek Dünya Kullanım Durumları

Doğru mimariyi seçmek, donanımınıza ve uygulama kısıtlamalarınıza büyük ölçüde bağlıdır.

Ne zaman YOLOv7 kullanılmalı

YOLOv7, belirli tensör yapılarıyla zaten derinlemesine entegre edilmiş eski hatları korumak veya 2022 ve 2023'teki akademik kıyaslamaları kopyalamak için güvenilir bir seçim olmaya devam etmektedir. Üst düzey sunucu GPU'larında takdire şayan bir performans sergiler.

Ne zaman YOLOv10 kullanılmalı

YOLOv10, katı ve değişmeyen gecikme süreleri gerektiren senaryolarda parlar. NMS'siz olduğu için, nesne sayısının hızla dalgalandığı ancak kare başına işlem süresinin sabit kalması gereken yüksek yoğunluklu kalabalık sayımı veya manufacturing defect detection için mükemmeldir.

YOLO26 ne zaman kullanılır?

YOLO26, her türlü yeni proje için kesin seçimdir. Temel bir Raspberry Pi üzerinde karmaşık security alarm systems dağıtmaktan büyük bulut tabanlı video analitiği çalıştırmaya kadar, üstün CPU hızları ve gelişmiş küçük nesne algılama özellikleri onu eski nesillerden çok daha üstün kılar.

Alternatif modern mimarileri keşfetmek isteyen geliştiriciler için, RT-DETR gibi transformer tabanlı algılayıcılar ve Ultralytics YOLO11 gibi önceki nesil temel modeller için de kapsamlı destek sağlıyoruz.

Yorumlar