İçeriğe geç

YOLOv10 ve YOLOv7: Gerçek Zamanlı Nesne Tespitinin Evrimi

Son birkaç yılda bilgisayar görüşündeki hızlı ilerleme, gerçek zamanlı uygulamalar için giderek daha verimli mimariler ortaya çıkarmıştır. YOLOv10 ve YOLOv7'yi karşılaştırmak, bu evrimdeki kritik bir geçiş dönemini vurgulamaktadır. YOLOv7 oldukça etkili eğitim stratejileri ve mimari ölçeklendirme sunarken, YOLOv10, uzun süredir devam eden NMS bağımlılığını ortadan kaldırarak dağıtımı devrim niteliğinde değiştirmiştir.

Her iki model de kendi yayınlandıkları dönemde nesne tespiti sınırlarını zorlamış olsa da, modern Ultralytics ekosistemi ve YOLO26 gibi yeni nesil modellerin tanıtılması, günümüzün yapay zeka uygulayıcıları için çok daha üstün iş akışları sunmaktadır.

Model Profilleri ve Kökenleri

Bu modellerin kökenlerini anlamak, mimari tasarım seçimleri ve bunları yönlendiren akademik araştırmalar hakkında değerli bir bağlam sağlar.

YOLOv10 Detayları

YOLOv10 hakkında daha fazla bilgi edinin.

YOLOv7 Detayları

YOLOv7 hakkında daha fazla bilgi edinin.

Mimari Yenilikler

YOLOv7 Yaklaşımı

2022'de piyasaya sürülen YOLOv7, gradyan yollarını optimize etmeye büyük ölçüde odaklandı. Modelin orijinal gradyan yolunu bozmadan daha çeşitli özellikler öğrenmesini sağlayan Genişletilmiş Verimli Katman Toplama Ağı'nı (E-ELAN) tanıttı. Ayrıca, yazarlar, hızlı yürütme hızlarını korumak için çıkarım sırasında birleştirilebilecek yeniden parametreleme tekniklerini kullanarak "eğitilebilir bedava özellikler" metodolojisini uyguladılar. Bu etkileyici optimizasyonlara rağmen, YOLOv7 hala işlem sonrası için NMS'ye büyük ölçüde güveniyordu ve yoğun sahne analizi sırasında değişken gecikme süresi yaratıyordu.

YOLOv10 Atılımı

YOLOv10, NMS darboğazını doğrudan ele aldı. Tsinghua Üniversitesi ekibi, eğitim sırasında tutarlı ikili atamalar sunarak NMS'siz uçtan uca tespiti mümkün kıldı. Bu çift başlı yaklaşım, eğitim sırasında zengin denetleyici sinyaller için bire çok atamalı bir dal ve NMS'siz çıkarım için bire bir atamalı başka bir dal kullanır. Bu mimari değişim, yüksek hızlı video analizi için uygun, tutarlı, ultra düşük çıkarım gecikmesi sağlar. Ayrıca, YOLOv10, önceki nesillerde bulunan hesaplama fazlalığını ortadan kaldıran bütünsel bir verimlilik-doğruluk odaklı model tasarımı kullanır.

İşlem Sonrası Etkisi

NMS işlem sonrası kaldırmak sadece çıkarımı hızlandırmakla kalmaz, aynı zamanda özel NMS işlemlerinin derlenmesinin zor olduğu yapay zeka hızlandırıcıları ve NPU'lar gibi kenar yapay zeka donanımlarında dağıtımı önemli ölçüde basitleştirir.

Performans Karşılaştırması

MS COCO veri kümesi üzerindeki ham metrikler karşılaştırıldığında, nesiller arası fark belirginleşir. YOLOv10, parametreler, hesaplama gereksinimleri ve doğruluk arasında çok daha uygun bir denge sağlar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Yukarıda görüldüğü gibi, YOLOv10x, YOLOv7x'in %53,1'lik mAP değerine kıyasla %54,4'lük üstün bir mAP sunarken, yaklaşık %20 daha az parametre kullanır. Ayrıca, hafif YOLOv10 modelleri (Nano ve Small), olağanüstü TensorRT dağıtım hızları sunarak mobil dağıtım için oldukça cazip hale gelir.

Ultralytics Ekosisteminin Avantajı

Mimari makaleleri incelemek aydınlatıcı olsa da, modern bilgisayar görüşü geliştirme sağlam, iyi bakımlı çerçevelere dayanır. Ultralytics destekli bir model seçmek, prototipten üretime hızla geçmek isteyen geliştiriciler için büyük bir avantaj sağlar.

Kolaylaştırılmış Geliştirme

Hem YOLOv10 hem de YOLOv7'ye standart Ultralytics Python paketi aracılığıyla erişilebilir. Bu, binlerce satır kalıp kodu basit, sezgisel bir API ile değiştirerek eşsiz bir Kullanım Kolaylığı sağlar. Ayrıca, Ultralytics YOLO modelleri, ağır transformer mimarilerine kıyasla eğitim sırasında önemli ölçüde daha düşük CUDA belleği gerektirir, bu da tüketici sınıfı donanımlarda daha büyük toplu iş boyutlarının kullanılmasına olanak tanır.

Rakipsiz Çok Yönlülük

Eski depolar genellikle yalnızca sınırlayıcı kutu tespitine odaklanırken, entegre Ultralytics çerçevesi çok çeşitli görevleri sorunsuz bir şekilde destekler. İster Örnek Segmentasyonu, Poz Tahmini veya Yönlendirilmiş Sınırlayıcı Kutu (OBB) tespiti yapıyor olun, iş akışı aynı kalır.

Kod Örneği: Tutarlı Eğitim İş Akışları

Aşağıdaki kod parçacığı, veri artırma ve öğrenme oranı çizelgelemesini otomatik olarak ele alan sorunsuz eğitim sürecini göstermektedir:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

Kullanım Durumları ve Öneriler

YOLOv10 ve YOLOv7 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

YOLOv10 Ne Zaman Tercih Edilmeli?

YOLOv10 için güçlü bir seçenektir:

  • NMS-Serbest Gerçek Zamanlı Algılama: Non-Maximum Suppression olmadan uçtan uca algılamadan faydalanan, dağıtım karmaşıklığını azaltan uygulamalar.
  • Dengeli Hız-Doğruluk Dengelemeleri: Çeşitli model ölçeklerinde çıkarım hızı ve algılama doğruluğu arasında güçlü bir denge gerektiren projeler.
  • Tutarlı Gecikme Süreli Uygulamalar: Tahmin edilebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları, örneğin robotik veya otonom sistemler.

YOLOv7 Ne Zaman Tercih Edilmeli?

YOLOv7 için önerilir:

  • Akademik Kıyaslama: 2022 dönemi son teknoloji sonuçlarını yeniden üretmek veya E-ELAN ve eğitilebilir 'bag-of-freebies' tekniklerinin etkilerini incelemek.
  • Yeniden Parametrelendirme Araştırması: Planlı yeniden parametrelendirilmiş evrişimleri ve bileşik model ölçekleme stratejilerini araştırmak.
  • Mevcut Özel İşlem Hatları: YOLOv7'nin özel mimarisi etrafında inşa edilmiş, yoğun şekilde özelleştirilmiş ve kolayca yeniden düzenlenemeyen işlem hatlarına sahip projeler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Yeni Standart: YOLO26 Tanıtılıyor

YOLOv10, 2024'te büyük bir ilerleme kaydetmiş olsa da, bilgisayar görüşü alanı inanılmaz hızlı ilerlemektedir. Tüm yeni geliştirmeler için, en yeni nesil modeli şiddetle tavsiye ediyoruz: Ultralytics YOLO26. Ocak 2026'da piyasaya sürülen bu model, hem YOLOv7 hem de YOLOv10'u büyük ölçüde geride bırakarak gerçek zamanlı görüntü yapay zekasının mutlak zirvesini temsil etmektedir.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, modern dağıtım ortamları için özel olarak tasarlanmış benzeri görülmemiş yenilikler sunmaktadır:

  • Uçtan Uca NMS-Serbest Tasarım: YOLOv10 tarafından atılan temeller üzerine inşa edilen YOLO26, daha basit dağıtım hatları ve tutarlı yüksek hızlı çıkarım için NMS son işlemeyi doğal olarak ortadan kaldırır.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Uç bilişim ve özel GPU'ları olmayan cihazlar için yoğun şekilde optimize edilmiş olup, donanım maliyetlerinde büyük tasarruflar sağlar.
  • DFL Kaldırılması: Distribution Focal Loss tamamen kaldırılmıştır, bu da dışa aktarma mantığını kökten basitleştirir ve düşük güçlü uç cihazlar ile mikrodenetleyicilerle uyumluluğu büyük ölçüde artırır.
  • MuSGD Optimizatörü: Moonshot AI'nin Kimi K2'sinden esinlenilen SGD ve Muon'un bu hibriti, Büyük Dil Modeli (LLM) eğitim yeniliklerini doğrudan bilgisayar görüşüne taşıyarak inanılmaz derecede kararlı eğitim dinamikleri ve daha hızlı yakınsama sağlar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, dronlar, robotik ve akıllı şehir izleme için kritik öneme sahip, tarihsel olarak zorlu bir alan olan küçük nesne tanımada önemli iyileştirmeler sunar.
  • Göreve Özel İyileştirmeler: YOLO26 sadece bir detectör değildir. Ultra hassas poz track için özel semantik segmentasyon kaybı, Residual Log-Likelihood Estimation (RLE) ve obb sınır sorunlarını ortadan kaldırmak için özel açı kaybı algoritmaları içerir.

Veri Kümelerini ve Eğitimi Yönetme

Veri kümelerinizi yönetme, YOLO26'yı eğitme ve modelleri buluta dağıtma konusunda mutlak en iyi deneyim için Ultralytics Platformu'nu keşfedin. python SDK'sını mükemmel şekilde tamamlayan kodsuz bir arayüz sunar.

Gerçek Dünya Kullanım Durumları

Doğru mimariyi seçmek, büyük ölçüde donanım ve uygulama kısıtlamalarınıza bağlıdır.

Ne Zaman YOLOv7 Kullanılmalı

YOLOv7, belirli tensor yapılarıyla zaten derinlemesine entegre olan eski boru hatlarını sürdürmek veya 2022 ve 2023'ten akademik kıyaslamaları tekrarlarken güvenilir bir seçim olmaya devam etmektedir. Üst düzey sunucu GPU'larında takdire şayan bir performans sergiler.

YOLOv10 ne zaman kullanılır

YOLOv10, katı, değişmeyen gecikme süresi gerektiren senaryolarda öne çıkar. NMS-serbest olduğu için, nesne sayısının büyük ölçüde dalgalandığı ancak kare başına işlem süresinin sabit kalması gereken yüksek yoğunluklu kalabalık sayımı veya üretim hatası detect için mükemmeldir.

YOLO26 Ne Zaman Kullanılmalı

YOLO26, her türlü sıfırdan proje için kesin bir seçimdir. Temel bir Raspberry Pi üzerinde gelişmiş güvenlik alarm sistemleri dağıtmaktan, büyük bulut tabanlı video analitikleri çalıştırmaya kadar, üstün CPU hızları ve gelişmiş küçük nesne detect yeteneği onu eski nesillere göre çok daha üstün kılar.

Alternatif modern mimarileri keşfetmek isteyen geliştiriciler için, RT-DETR gibi transformatör tabanlı detectörler ve Ultralytics YOLO11 gibi önceki nesil temel modeller için de kapsamlı destek sağlıyoruz.


Yorumlar