YOLOv10 YOLOv8: Gerçek Zamanlı Nesne Algılama Mimarisinde Gelişmeler
Gerçek zamanlı nesne algılama alanı, hız, doğruluk ve verimlilik sınırlarını zorlayan yeni mimarilerle sürekli olarak gelişmektedir. Bu teknik karşılaştırma, YOLOv10, maksimum olmayan bastırmayı (NMS) ortadan kaldırmaya odaklanan akademik bir çığır açan çalışma ve Ultralytics YOLOv8'yi derinlemesine incelemektedir.
Mimari farklılıklarını, performans ölçütlerini ve eğitim metodolojilerini analiz ederek, geliştiriciler kenar dağıtımından yüksek verimli bulut çıkarımına kadar uzanan bilgisayar görme uygulamaları için bir model seçerken bilinçli kararlar verebilirler.
Performans Metrikleri Karşılaştırması
Aşağıdaki tablo, temel performans göstergelerinin ayrıntılı bir karşılaştırmasını sunmaktadır. YOLOv10 , NMS adımını kaldırarak rekabetçi bir gecikme süresi YOLOv10 , YOLOv8 ise sadece algılama ötesinde daha geniş bir görev yelpazesi için uygun dengeli bir profil YOLOv8 .
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv10: Uçtan Uca Öncü
YOLOv10 , Tsinghua Üniversitesi'nden araştırmacılar tarafından, post-processing sırasında Non-Maximum Suppression (NMS) bağımlılığını ortadan kaldırmak amacıyla tanıtıldı. Geleneksel YOLO , tek bir nesne için birden fazla sınırlayıcı kutu tahmin eder ve yinelenenleri filtrelemek NMS güvenir. YOLOv10 , eğitim sırasında tutarlı bir çift atama stratejisi YOLOv10 ve modelin nesne başına doğrudan tek bir en iyi kutu tahmin etmesini sağlar.
Mimari ve İnovasyon
- NMS Eğitim: Zengin denetim için bir-çok ve verimli çıkarım için bir-bir olmak üzere çift etiket atamalarını kullanarakYOLOv10 , NMS neden olduğu çıkarım gecikmesiniYOLOv10 .
- Bütünsel Verimlilik Tasarımı: Mimari, doğruluktan ödün vermeden hesaplama yükünü (FLOP) azaltmak için hafif sınıflandırma başlıkları ve uzamsal kanal ayrıştırılmış aşağı örnekleme içerir.
- Büyük Çekirdekli Konvolüsyonlar: Büyük çekirdekli derinlik yönlü konvolüsyonların hedefe yönelik kullanımı, alıcı alanı iyileştirerek küçük nesnelerin algılanmasına yardımcı olur.
Meta Veriler:
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
- Kuruluş:Tsinghua Üniversitesi
- Tarih: 2024-05-23
- Arxiv:arXiv:2405.14458
- GitHub:THU-MIG/yolov10
YOLOv10 hakkında daha fazla bilgi edinin.
Ultralytics YOLOv8: Sağlam Endüstri Standardı
Ultralytics YOLOv8 çok yönlülük ve kullanım kolaylığı için tasarlanmış, olgun ve üretime hazır bir çerçeveyi temsil eder. Standart NMS kullanmasına rağmen, yüksek düzeyde optimize edilmiş mimarisi ve Ultralytics entegrasyonu, istikrar, çoklu görev desteği ve sorunsuz dağıtım gerektiren geliştiriciler için tercih edilen bir seçenek haline getirir.
Temel Mimari Güçlü Yönleri
- Birleşik Çerçeve: Algılama ile sınırlı birçok akademik modelin aksine, YOLOv8 tek bir kod tabanında örnek segmentasyonu, poz tahmini, OBB ve sınıflandırmayı YOLOv8 destekler.
- Anchor-Free Detection: Nesne merkezlerini doğrudan tahmin etmek için anchor tabanlı yaklaşımlardan uzaklaşarak, eğitim sürecini basitleştirir ve farklı veri kümeleri arasında genellemeyi iyileştirir.
- Mozaik Artırma: Gelişmiş anlık veri artırma, örtülmelere ve değişen aydınlatma koşullarına karşı sağlamlığı artırır.
- Optimize Edilmiş Ekosistem: Kullanıcılar, veri kümesi yönetimi, model eğitimi ve TensorRT, CoreML ve ONNX gibi formatlara tek tıklamayla dışa aktarma için Ultralytics (eski adıyla HUB) yararlanır.
Meta Veriler:
- Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2023-01-10
- GitHub:ultralytics/ultralytics
- Belgeler:YOLOv8 Belgeleri
YOLOv8 hakkında daha fazla bilgi edinin.
Uçtan Uca Algılamanın Geleceği
YOLOv10 , NMS algılamada YOLOv10 arken, yeni piyasaya sürülen YOLO26 bu temeli daha da geliştirmiştir. YOLO26, doğal olarak uçtan uca çalışır ve NMS Dağıtım Odak Kaybı (DFL) özelliklerini ortadan kaldırarak CPU %43'e kadar hızlandırır. MuSGD optimizer ve ProgLoss işlevlerini entegre ederek, hem YOLOv8 YOLOv10 kıyasla üstün stabilite ve küçük nesne algılama özelliği sunar.
Kullanım Durumları ve Gerçek Dünya Uygulamaları
Bu modeller arasında seçim yapmak genellikle dağıtım ortamının belirli kısıtlamalarına bağlıdır.
YOLOv10 için İdeal Senaryolar
YOLOv10 , son işlem gecikmesinin bir darboğaz olduğu uygulamalar için özellikle YOLOv10 .
- Kalabalık Sahne Analizi: Yaya algılama gibi yoğun nesne kümelerinin bulunduğu senaryolarda, NMS kaldırmak, önemli ölçüde örtüşen geçerli algılamaların "düşmesini" NMS .
- Düşük Güç Tüketimli Kenar Cihazları: Azaltılmış FLOP ve parametre sayısı, her milisaniyenin önemli olduğu Raspberry Pi veya Jetson Nano gibi sınırlı hesaplama gücüne sahip cihazlara dağıtımda yardımcı olur.
Ultralytics YOLOv8 için İdeal Senaryolar
YOLOv8 , güvenilirlik ve çoklu görev gerektiren kapsamlı AI çözümleri için en iyi seçenek YOLOv8 .
- Karmaşık Endüstriyel Denetim: Segmentasyon yapma yeteneği, basit sınırlayıcı kutular yerine kusurların kesin olarak belirlenmesi imkanı sağlar ve bu da üretimde kalite kontrolü için çok önemlidir.
- Spor Analitiği: Yerel poz tahmin desteği ile YOLOv8 , biyomekanik analiz için track hareketlerini ve iskelet anahtar noktalarını track YOLOv8 .
- Perakende Analitiği: Ultralytics entegre edilmiş sağlam nesne izleme özellikleri, müşteri akışını ve envanteri izlemek için idealdir.
Kullanım Kolaylığı ve Ekosistem
YOLOv8 veya daha yeni olan YOLO26) gibi bir Ultralytics seçmenin en önemli avantajlarından biri, onu çevreleyen ekosistemdir.
Basit Python : Geliştiriciler sadece birkaç satır kodla modelleri yükleyebilir, eğitebilir ve dağıtabilir.
from ultralytics import YOLO # Load a model model = YOLO("yolov8n.pt") # Train model.train(data="coco8.yaml", epochs=100)Kapsamlı Belgeler: Ultralytics , hiperparametre ayarlamadan iOS Android için model dışa aktarmaya kadar her konuda ayrıntılı kılavuzlar sunar.
- Bellek Verimliliği: Ultralytics , aşağıdaki gibi birçok Transformer tabanlı alternatife kıyasla eğitim sırasında daha düşük CUDA kullanımı için optimize edilmiştir RT-DETRgibi birçok Transformer tabanlı alternatiflere kıyasla daha düşük CUDA bellek kullanımı için optimize edilmiştir, bu da standart tüketici GPU'larında daha büyük parti boyutlarına olanak tanır.
Sonuç
Her iki mimari de belirgin avantajlar sunar. YOLOv10 , NMS algılamanın potansiyelini gösteren ve yalnızca algılama görevleri için yüksek verimlilik sunan mükemmel bir akademik katkıdır.
Ultralytics YOLOv8 , makine öğreniminin tüm yaşam döngüsünü basitleştiren, sürdürülebilir bir ekosistemle desteklenen, çok yönlü ve çok yönlü bir seçenek olarak öne çıkıyor. Segmentasyon ve poz tahmini gibi çeşitli görevlerde prototip aşamasından üretime hızlı bir şekilde geçmesi gereken geliştiriciler için en çok önerilen seçenek olmaya devam ediyor.
En üst düzey performansı arayanlar için, YOLO26 en iyi seçimdir. YOLOv10 tarafından öncülüğünü yaptığı uçtan uca, NMS avantajları Ultralytics sağlamlığı, çoklu görev desteği ve kullanım kolaylığı YOLOv10 birleştirir. MuSGD optimizeri ve geliştirilmiş kayıp fonksiyonları gibi yeniliklerle YOLO26, 2026 için hız ve doğruluk arasında en gelişmiş dengeyi sunar.
Daha Fazla Okuma
- En yeni SOTA modelini keşfedin: YOLO26
- Gerçek zamanlı dönüştürücüler hakkında bilgi edinin: RT-DETR
- Metrikleri anlayın: mAP IoU
- Verimli eğitim rehberi: Model Eğitim İpuçları