İçeriğe geç

YOLOv10 ve YOLOv8: Gerçek Zamanlı Nesne Algılama için Teknik Bir Karşılaştırma

YOLO (You Only Look Once) ailesinin gelişimi, geliştiricilere nesne algılama için daha hızlı ve daha doğru araçlar sunarak bilgisayarla görmenin sınırlarını sürekli olarak zorladı. Arasında seçim yaparken YOLOv10 ve YOLOv8mimari, verimlilik ve ekosistem desteğindeki nüansları anlamak çok önemlidir. YOLOv10 verimlilik için yeni mimari değişiklikler getirirken, YOLOv8 kullanım kolaylığı ve kapsamlı özellik setiyle bilinen sağlam, çok yönlü bir standart olmaya devam etmektedir.

Bu kılavuz, makine öğrenimi projeleriniz için doğru modeli seçmenize yardımcı olacak ayrıntılı bir teknik karşılaştırma sunar.

Performans Analizi

COCO veri setindeki performans ölçümleri, bu modellerin arkasındaki farklı tasarım felsefelerini göstermektedir. YOLOv10 büyük ölçüde parametre sayısını ve kayan nokta işlemlerini (FLOP) azaltmaya odaklanır ve genellikle belirli bir model boyutu için daha yüksek mAP (ortalama Ortalama Hassasiyet) elde eder. Ancak, YOLOv8 özellikle CPU'larda ve aşağıdaki gibi optimize edilmiş formatlara aktarıldığında oldukça rekabetçi çıkarım hızlarını korur TensorRTham hız ile pratik dağıtım yeteneklerini dengeliyor.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOv10: Mimari İnovasyon Yoluyla Verimlilik

Yazarlar: Ao Wang, Hui Chen, Lihao Liu, et al.
Organizasyon:Tsinghua Üniversitesi
Tarih: 2024-05-23
Arxiv:YOLOv10: Gerçek Zamanlı Uçtan Uca Nesne Algılama
GitHub:THU-MIG/yolov10

YOLOv10 , Tsinghua Üniversitesi'ndeki araştırmacılar tarafından birincil bir hedefle geliştirilmiştir: işlem sonrası sırasında maksimum olmayan bastırmayaNMS) olan bağımlılığı ortadan kaldırmak. NMS , gecikme açısından kritik uygulamalarda bir darboğaz oluşturabilir. YOLOv10 , eğitim sırasında tutarlı bir ikili atama stratejisi sunarak modelin her nesne için tek bir en iyi kutuyu tahmin etmesini sağlar ve bu da onu etkili bir şekilde uçtan uca bir dedektör haline getirir.

YOLOv10'un Temel Güçlü Yönleri

  • NMS'siz Çıkarım: YOLOv10 , NMS adımını kaldırarak işlem sonrası aşamadaki hesaplama ek yükünü azaltır ve bu da belirli uç senaryolarında gecikmeyi azaltabilir.
  • Parametre Verimliliği: Bütünsel model tasarımı, önceki nesillere kıyasla parametre ve FLOP sayısını önemli ölçüde azaltarak son derece sınırlı depolama alanına sahip cihazlar için cazip hale getirir.
  • Yüksek Doğruluk: Mimari optimizasyonlarının etkinliğini göstererek boyutuna göre son teknoloji mAP skorlarına ulaşır.

Zayıflıklar

  • Görev Uzmanlığı: YOLOv10 öncelikle nesne algılama için tasarlanmıştır. Kutudan çıktığı haliyle örnek segmentasyonu veya poz tahmini gibi diğer bilgisayarla görme görevleri için yerel destekten yoksundur.
  • Ekosistem Olgunluğu: Daha yeni bir akademik sürüm olarak, yerleşik Ultralytics ekosistemine kıyasla daha az üçüncü taraf entegrasyonuna ve topluluk kaynağına sahiptir.

YOLOv10 hakkında daha fazla bilgi edinin

Ultralytics YOLOv8: Çok Yönlü Endüstri Standardı

Yazarlar Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Organizasyon:Ultralytics
Tarih: 2023-01-10
Docs:Ultralytics YOLOv8 Documentation
GitHub:ultralytics

Ultralytics tarafından piyasaya sürülen YOLOv8 , pratik, kullanıcı dostu yapay zeka konusunda yıllarca süren araştırmaların bir sonucunu temsil ediyor. Sadece yüksek performans için değil, aynı zamanda olağanüstü bir geliştirici deneyimi için tasarlanmıştır. YOLOv8 , sağlam bir eğitim sağlamak için çapasız bir algılama mekanizması ve zengin bir gradyan akışı kullanır. Öne çıkan özelliği, tek ve birleşik bir çerçeve içinde algılama, segmentasyon, sınıflandırma, poz tahmini ve OBB gibi çok çeşitli görevler için yerel desteğidir.

  • Kullanım Kolaylığı: Ultralytics YOLOv8 basitliği ile ünlüdür Python ve CLI arayüzleri. Geliştiriciler sadece birkaç satır kod ile modelleri eğitebilir, doğrulayabilir ve dağıtabilir.
  • Bakımlı Ekosistem: Ultralytics ekosisteminin bir parçası olmak, sık güncellemelere, büyük bir topluluğa ve zahmetsiz model yönetimi için Ultralytics HUB gibi araçlarla sorunsuz entegrasyona erişim anlamına gelir.
  • Performans Dengesi: Hız ve doğruluk arasında ideal bir denge kurar. Model, CPU, GPU ve Edge TPU'lar dahil olmak üzere çeşitli donanım arka uçları için son derece optimize edilmiştir.
  • Eğitim Verimliliği: YOLOv8 , birçok transformatör tabanlı alternatife göre daha düşük bellek gereksinimi ile verimli eğitim süreçleri sunarak hesaplama maliyetlerinden tasarruf sağlar.
  • Çok yönlülük: Sınırlayıcı kutularla sınırlı modellerin aksine YOLOv8 , çerçeve değiştirmeden segmentasyon maskeleri veya anahtar noktalar gerektiren karmaşık projelerin üstesinden gelebilir.

Bellek Verimliliği

YOLOv8 gibi Ultralytics modelleri bellek açısından verimli olacak şekilde tasarlanmıştır. gibi hantal dönüştürücü modellerine kıyasla daha az CUDA belleği gerektirdiğinden, özel modellerin eğitimi için giriş engelini önemli ölçüde azaltır. RT-DETRBöylece tüketici sınıfı GPU'larda eğitim yapılabiliyor.

YOLOv8 hakkında daha fazla bilgi edinin

Karşılaştırmalı Analiz: Mimari ve Kullanım Örnekleri

Mimari Farklılıklar

Temel fark, işlem sonrası ve atama stratejilerinde yatmaktadır. YOLOv10 Bir kafanın eğitim sırasında zengin denetleyici sinyaller için bire-çok atama (geleneksel YOLO'lar gibi) kullandığı, diğerinin ise çıkarım için bire-bir atama kullandığı ve NMS ihtiyacını ortadan kaldıran çift kafalı bir mimari kullanır.

YOLOv8tersine, göreve göre hizalanmış bir atayıcı ve çapasız bir birleşik kafa yapısı kullanır. Bu tasarım algılama kafasını basitleştirir ve genelleştirmeyi geliştirir. NMS gerektirse de, işlem aşağıdaki gibi dışa aktarma formatlarında son derece optimize edilmiştir ONNX ve TensorRT arasındaki pratik gecikme farkını genellikle sağlam dağıtım hatlarında ihmal edilebilir hale getirir.

İdeal Kullanım Senaryoları

İkisi arasında seçim yapmak genellikle projenizin belirli kısıtlamalarına bağlıdır:

  1. Yüksek Performanslı Edge AI (YOLOv10): Uygulamanız, her megabayt depolamanın önemli olduğu ciddi kaynak kısıtlı donanımlarda çalışıyorsa veya NMS işlemi hedef çipinizde belirli bir darboğaz yaratıyorsa, YOLOv10 mükemmel bir adaydır. Örnekler arasında tarımda gömülü sensörler veya hafif dronlar yer alır.

  2. Genel Amaçlı ve Çok Görevli Yapay Zeka (YOLOv8): Ticari ve araştırma uygulamalarının büyük çoğunluğu için, YOLOv8 üstün bir seçimdir. Segmentasyon (örn. hassas tıbbi görüntüleme) ve poz tahmini (örn. spor analitiği) yapabilmesi onu inanılmaz derecede çok yönlü kılmaktadır. Ayrıca, kapsamlı dokümantasyonu ve desteği, geliştiricilerin sorunları hızlı bir şekilde çözebilmelerini ve daha hızlı dağıtım yapabilmelerini sağlar.

Kod Uygulaması

Ultralytics çerçevesinin en büyük avantajlarından biri birleşik API'dir. İster YOLOv8 kullanıyor olun ister daha yeni modelleri keşfediyor olun, iş akışı tutarlı ve sezgisel kalır.

İşte Python kullanarak bir YOLOv8 modeli için eğitimi nasıl kolayca başlatabileceğiniz:

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on your custom dataset
# The system automatically handles data downloading and processing
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

YOLOv10 için Ultralytics paketi de erişimi kolaylaştırarak araştırmacıların tanıdık bir ortamda mimariyi denemelerine olanak tanır:

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train the model using the same simple API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Sonuç

Hem YOLOv10 hem de YOLOv8 bilgisayarla görme alanında etkileyici kilometre taşlarıdır. YOLOv10 mimari verimlilik konusunda sınırları zorlayarak, özel düşük gecikmeli uygulamalar için NMS'siz geleceğe bir bakış sunuyor.

Ancak, Ultralytics YOLOv8 geliştiriciler ve kuruluşlar için önerilen model olmaya devam etmektedir. Sağlam ekosistemi, kanıtlanmış güvenilirliği ve çoklu görev yetenekleri, basit algılamanın ötesine geçen kapsamlı bir çözüm sunar. Ultralytics YOLOv8 ile sadece bir model değil, birinci sınıf yapay zeka çözümlerini verimli bir şekilde oluşturmak, eğitmek ve dağıtmak için eksiksiz bir araç seti elde edersiniz.

En son teknolojiyi takip etmek isteyenler için ayrıca YOLO11Ultralytics 'in YOLOv8'e göre daha da yüksek performans ve verimlilik kazanımları sağlayan en son yinelemesi.

Daha Fazla Okuma


Yorumlar