İçeriğe geç

YOLOv6.0 ile YOLOv10: Gerçek Zamanlı Nesne Algılamanın Evrimi

Nesne algılama alanı, mimari atılımların hız ve doğruluk sınırlarını sürekli olarak yeniden tanımladığı hızlı inovasyonla karakterize edilir. Bu yolculuktaki iki önemli dönüm noktası, endüstriyel uygulamalar için tasarlanmış bir model olan YOLOv6.YOLOv6 ve YOLOv10, uçtan uca verimliliğe odaklanan akademik bir atılımdır.

YOLOv6. YOLOv6, niceleme ve TensorRT yoluyla özel donanımdaki verimi ön plana çıkarırken, YOLOv10 , daha düşük gecikme süresi için Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak bir paradigma değişikliği YOLOv10 . Bu karşılaştırma, geliştiricilerin bilgisayar görme projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla teknik mimarilerini, performans ölçütlerini ve ideal kullanım örneklerini inceliyor.

Performans Metrikleri Karşılaştırması

Aşağıdaki tablo, çeşitli model ölçeklerinde iki mimari arasındaki performans farklarını göstermektedir. YOLOv6. YOLOv6 güçlü sonuçlar sunarken, YOLOv10 daki yeni mimari optimizasyonlar YOLOv10 daha üstün doğruluk-parametre oranları sağlar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv6.0: Endüstriyel Çalışma Atı

YOLOv6, tek bir odak noktası ile tasarlanmıştır: endüstriyel ortamlarda verimi en üst düzeye çıkarmak. Çin'in önde gelen e-ticaret platformu Meituan tarafından geliştirilen bu yazılım, özel GPU kullanıma öncelik vermektedir.

Yazar: Chuyi Li, Lulu Li, Yifei Geng, et al.
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv: YOLOv6 .0: Tam Ölçekli Yeniden Yükleme
GitHub: Meituan YOLOv6

Mimari ve Güçlü Yönler

YOLOv6 , GPU erişim modellerine son derece uygun olan EfficientRep olarak backbone VGG tarzı bir backbone YOLOv6 . En önemli yeniliği, Quantization-Aware Training (QAT) ve damıtma ile derin entegrasyonunda yatmaktadır. Bu, modelin INT8'e kuantize edildiğinde bile yüksek doğruluğu korumasını sağlar. Bu, NVIDIA TensorRT gibi donanım hızlandırıcıları olan uç cihazlarda dağıtım için kritik bir özelliktir.

"v3.0" güncellemesi, boyunda çift yönlü füzyon (BiFusion) özelliğini getirerek ölçekler arası özellik entegrasyonunu geliştirdi. Bu, paket segmentasyonu veya otomatik kalite kontrolü gibi karmaşık endüstriyel ortamlarda farklı boyutlardaki nesneleri algılamada özellikle etkili olmasını sağlar.

Endüstriyel Optimizasyon

YOLOv6 , "Rep" (yeniden parametreleştirme) paradigması için büyük ölçüde optimize YOLOv6 . Eğitim sırasında model, daha iyi gradyan akışı için çok dallı bloklar kullanır, ancak çıkarım sırasında bunlar tek dallı 3x3 konvolüsyonlara birleşir. Bu, GPU'larda daha hızlı çıkarım sağlar, ancak eğitim aşamasında bellek kullanımını artırabilir.

Zayıf yönleri: Ankraj tabanlı mekanizmalara ve geleneksel NMS bağımlılık, YOLOv6 algılanan nesne sayısına bağlı olarak genellikle değişken gecikme sürelerine sahip olması anlamına gelir. Ayrıca, CPU , mobil CPU'lar için tasarlanmış yeni mimarilere kıyasla genellikle daha az optimize edilmiştir.

YOLOv6 hakkında daha fazla bilgi edinin.

YOLOv10: Uçtan Uca Öncü

YOLOv10 , son işlemdeki darboğazı ele alarak geleneksel YOLO önemli bir ayrılma kaydetti. Tsinghua Üniversitesi'ndeki araştırmacılar tarafından oluşturulan bu formül, Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırmak için tutarlı bir çift atama stratejisi getirdi.

Yazar: Ao Wang, Hui Chen, Lihao Liu, et al.
Kuruluş: Tsinghua Üniversitesi
Tarih: 2024-05-23
Arxiv: YOLOv10: Gerçek Zamanlı Uçtan Uca Nesne Algılama
GitHub: Tsinghua YOLOv10

Mimari ve Güçlü Yönler

YOLOv10 belirleyici özelliği, NMS tasarımıdır. Geleneksel dedektörler, filtrelenmesi gereken gereksiz tahminler üretir ve bu da değerli çıkarım süresini tüketir. YOLOv10 , eğitim sırasında zengin denetim için "birden çoğa" atama YOLOv10 , ancak çıkarım için "birden bire" eşleştirmeye geçer. Bu, modelin nesne başına tam olarak bir kutu çıktısı vermesini sağlar ve gecikme varyansını önemli ölçüde azaltır.

Ayrıca, YOLOv10 bütünsel bir verimlilik-doğruluk odaklı tasarım YOLOv10 . Hafif sınıflandırma başlıkları ve uzamsal kanal ayrıştırılmış aşağı örneklemeyi kullanarak, ortalama hassasiyeti (mAP) feda etmeden hesaplama yükünü (FLOP) azaltır. Bu da onu son derece çok yönlü hale getirir ve otonom sürüşten gerçek zamanlı gözetime kadar çeşitli uygulamalar için uygun kılar.

Zayıf yönleri: Öncelikle akademik bir araştırma projesi olan YOLOv10 , ticari olarak desteklenen çerçevelerde bulunan sağlam, kurumsal düzeyde araçlardan yoksun YOLOv10 . Mimari yenilikçi olsa da, kullanıcılar, özel destek ekipleri olan modellere kıyasla uzun vadeli bakım ve karmaşık CI/CD boru hatlarına entegrasyon konusunda zorluklarla karşılaşabilir.

YOLOv10 hakkında daha fazla bilgi edinin.

Ultralytics Avantajı: Neden YOLO26'yı Seçmelisiniz?

YOLOv6. YOLOv6 ve YOLOv10 , bilgisayar görme tarihinde önemli adımlar YOLOv10 , Ultralytics modeli, en üst düzey performans, kullanım kolaylığı ve ekosistem desteği arayan geliştiriciler için en iyi seçenek olarak öne çıkıyor.

2026 yılının Ocak ayında piyasaya sürülen YOLO26, önceki sürümlerin en iyi özelliklerini bir araya getirirken, modern dağıtım için çığır açan optimizasyonlar sunuyor.

YOLO26'nın Temel Avantajları

  1. Uçtan Uca NMS Tasarım: YOLOv10 mirasını temel alan YOLO26, doğal olarak uçtan uca bir tasarımdır. NMS tamamen ortadan kaldırarak, deterministik gecikme süresi ve basitleştirilmiş dağıtım mantığı sağlar.
  2. Edge-First Optimizasyonu: Dağıtım Odak Kaybını (DFL) ortadan kaldırarak, YOLO26 dışa aktarım için model grafiğini basitleştirir. Bu, CPU %43'e kadar hızlandırır ve onu Raspberry Pi veya cep telefonları gibi cihazlarda kenar bilişim için tartışmasız lider yapar.
  3. MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitim stabilitesinden esinlenen YOLO26, MuSGD optimizer'ı ( SGD Muon'un bir karışımı) kullanır. Bu, daha hızlı yakınsama ve daha stabil eğitim çalıştırmaları sağlayarak, optimum doğruluğa ulaşmak için gereken zamanı ve hesaplama maliyetini azaltır.
  4. Gelişmiş Kayıp Fonksiyonları: ProgLoss ve STAL'ın entegrasyonu, drone görüntüleme ve uzaktan gözetleme için kritik bir yetenek olan küçük nesne tanıma konusunda önemli iyileştirmeler sağlar.

Eşsiz Ekosistem Desteği

Ultralytics seçmek, sadece bir model mimarisi seçmekten daha Ultralytics ; kapsamlı bir geliştirme platformuna erişim elde etmek anlamına gelir.

  • Kullanım Kolaylığı: Ultralytics , sadeliği ile endüstri standardıdır. Modeller veya görevler ( poz tahmini veya OBB gibi) arasında geçiş yapmak için minimum kod değişikliği gerekir.
  • Eğitim Verimliliği: Ultralytics , bellek verimliliği ile ünlüdür. Büyük GPU gerektiren ağır transformatör tabanlı modellerin aksine, YOLO26 tüketici sınıfı donanımlarda etkili bir şekilde çalışacak şekilde optimize edilmiştir.
  • Çok yönlülük: Genellikle yalnızca sınırlayıcı kutulara odaklanan rakiplerinden farklı olarak, Ultralytics , örnek segmentasyonu, sınıflandırma ve yönlendirilmiş sınırlayıcı kutuları kullanıma hazır olarak destekler.

Projelerinizi Geleceğe Hazırlayın

Ultralytics kullanmak, projenizin gelecekteki gelişmelerle uyumlu kalmasını sağlar. YOLO26 gibi yeni bir mimari piyasaya sürüldüğünde, eğitim döngülerinizi veya veri yükleyicilerinizi yeniden yazmanıza gerek kalmadan, komut dosyanızdaki model adını değiştirerek üretim boru hattınızı yükseltebilirsiniz.

Kod Örneği: Kesintisiz Eğitim

Ultralytics Python , bu modelleri tek bir arayüz altında birleştirir. YOLOv10 NMS özelliklerini YOLOv10 YOLO26'nın ham hızını deniyor olsanız da, iş akışı tutarlı kalır.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a dataset (e.g., COCO8) with efficient settings
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Use GPU 0
)

# Run inference with NMS-free speed
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

YOLOv6.0 ve YOLOv10karşılaştırıldığında, seçim genellikle belirli donanım kısıtlamalarına bağlıdır. YOLOv6. YOLOv6, TensorRT özel GPU'lara yoğun yatırım yapılmış eski sistemler için güçlü bir rakip olmaya devam etmektedir. YOLOv10 , benzer doğruluk için son işlemi basitleştiren ve parametre sayısını azaltan modern bir mimari yaklaşım YOLOv10 .

Ancak, her iki dünyanın da en iyisini isteyen geliştiriciler için — en son teknolojiye sahip NMS mimari ile sağlam, desteklenen bir ekosistemin birleşimi —Ultralytics önerilen çözümdür. Üstün CPU , gelişmiş MuSGD optimizörü ve Ultralytics ile sorunsuz entegrasyonu, onu gerçek dünya AI uygulamaları için en çok yönlü ve geleceğe dönük seçim haline getirir.

Diğer yüksek verimli modelleri keşfetmek isteyen kullanıcılar için, aşağıdaki modeli de incelemenizi öneririz YOLO11 ve açık sözlük algılama için YOLO modellerine bakmalarını öneririz.


Yorumlar