YOLO . YOLOv10: Gerçek Zamanlı Nesne Algılamanın Evrimini Keşfetmek

Gerçek zamanlı nesne algılama alanı, daha düşük gecikme süresi ve daha yüksek doğruluk arayışının etkisiyle hızla gelişmiştir. Bu yolculuktaki iki önemli dönüm noktası, Alibaba Group tarafından geliştirilen YOLO ve YOLOv10'dir.YOLO , bu alana gelişmiş Sinirsel MimariYOLO (NAS)YOLO YOLOv10 , Maksimum Baskılamayı (NMS) YOLOv10 dağıtım sürecinde YOLOv10 Bu kapsamlı karşılaştırma, teknik mimarilerini, performans ölçütlerini ve YOLO26 gibi en yeni Ultralytics üretim ortamları için bu gelişmelerin zirvesini temsil etmesinin nedenlerini incelemektedir.

Performans Metriklerinin Karşılaştırılması

Aşağıdaki tablo, temel performans göstergelerinin doğrudan karşılaştırmasını sunmaktadır. Özellikle NMS tasarımların daha düşük gecikme süresine katkıda bulunduğu durumlarda, çıkarım hızlarındaki farklara dikkat edin.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO: Mimari ve Metodoloji

YOLO, Kasım 2022'de Alibaba Group'tan araştırmacılar tarafından önerildi. En son teknolojileri uyumlu bir dedektör çerçevesine entegre ederek performans sınırlarını zorlamayı amaçlıyordu.

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Makale:arXiv:2211.15444
GitHub:tinyvision/DAMO-YOLO

Temel Mimari Özellikler

YOLO Sinir Mimarisi Arama (NAS) kullanımıylaYOLO . Manuel olarak tasarlanmış omurgalara sahip modellerden farklı olarak,YOLO , belirli kısıtlamalar altında optimum ağ yapılarını keşfetmek için Yöntem Farkındalığına Sahip Verimli NAS (MAE-NAS)YOLO . Bu, hedeflenen belirli donanım için son derece verimli backbone sonuçlanır.

Ek olarak, özellik füzyonu için verimli bir RepGFPN (Reparameterized Generalized Feature Pyramid Network) ve "ZeroHead" olarak bilinen hafif bir başlık içerir. Eğitim stratejisinin önemli bir bileşeni, sınıflandırma ve regresyon görevleri arasında iyileştirilmiş hizalamayı çözen dinamik bir etiket atama mekanizması olan AlignedOTA'dır. Ancak,YOLO ile en yüksek performansı elde etmekYOLO karmaşık bir damıtma süreci gerektirir ve bu da eğitim sırasında ağır bir öğretmen modeli gerektirir, bu da "bag-of-freebies" yaklaşımlarına kıyasla hesaplama yükünü önemli ölçüde artırabilir. YOLOv8'da kullanılan "bag-of-freebies" yaklaşımlarına kıyasla hesaplama yükünü önemli

Eğitim Karmaşıklığı

Güçlü olmasına rağmen,YOLO için eğitim süreci kaynak yoğunYOLO . Damıtma aşaması genellikle önce daha büyük bir öğretmen modelinin eğitilmesini gerektirir, bu da özel veri kümeleri üzerinde hızlı yinelemelere ihtiyaç duyan geliştiriciler için iş akışını karmaşıklaştırır.

YOLOv10: Uçtan Uca Atılım

Tsinghua Üniversitesi tarafından Mayıs 2024'te yayınlanan YOLOv10 , nesne algılamada en uzun süredir devam eden darboğazlardan biri olan Maksimum Olmayan Bastırma (NMS) sorununu ele alarak bir paradigma değişikliğine imza attı.

Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
Kuruluş: Tsinghua University
Tarih: 2024-05-23
Makale:arXiv:2405.14458
GitHub:THU-MIG/yolov10

Mimari Yenilikler

YOLOv10 belirleyici özelliği YOLOv10 uçtan uca NMS YOLOv10 . Geleneksel dedektörler, NMS tarafından filtrelenmesi gereken gereksiz sınırlayıcı kutular oluşturur. Bu, gecikmeye neden olan ve dağıtımı karmaşıklaştıran bir son işlem adımıdır. YOLOv10 , eğitim sırasında Tutarlı Çift Atamalar YOLOv10 ; hem bir-çok (zengin denetim için) hem de bir-bir (uçtan uca çıkarım için) eşleştirme kullanır. Bu, modelin nesne başına tek bir en iyi kutuyu doğrudan tahmin etmesini sağlar ve NMS olan ihtiyacı ortadan kaldırır.

Ayrıca, YOLOv10 , bütünsel bir verimlilik-doğruluk odaklı model tasarımı YOLOv10 . Bu tasarım, hafif sınıflandırma başlıkları, uzamsal kanal ayrıştırılmış aşağı örnekleme ve sıralama kılavuzlu blok tasarımı içerir ve sonuç olarak, önceki modellerden daha küçük ve daha hızlı bir model ortaya çıkar. YOLOv9 gibi önceki modellerden daha küçük ve daha hızlıdır.

YOLOv10 hakkında daha fazla bilgi edinin.

Ultralytics Avantajı: Neden YOLO26'yı Seçmelisiniz?

YOLO YOLOv10 önemli akademik katkılar YOLOv10 , Ultralytics en son araştırmalar ile pratik ve güvenilir üretim yazılımları arasında köprü görevi görüyor. Yeni piyasaya sürülen YOLO26, YOLOv10 NMS çığır açan özelliğini temel alıyor, YOLOv10 bunu sağlam, kurumsal düzeyde bir çerçeveye entegre ediyor.

Üstün Performans ve Verimlilik

YOLO26, yeni projeler için önerilen seçimdir ve hemYOLO saf YOLOv10 göre belirgin avantajlar sunar:

Uçtan Uca NMS: YOLOv10 gibi, YOLO26 de doğal olarak uçtan uca çalışır. NMS ortadan kaldırarak dağıtım süreçlerini basitleştirir ve gecikme değişkenliğini önemli ölçüde azaltır.
Gelişmiş Eğitim Kararlılığı: YOLO26, Büyük Dil Modeli (LLM) eğitiminden esinlenerek SGD Muon'un birleşiminden oluşan MuSGD Optimizer'ı kullanır. Bu yenilik, eğitim sırasında daha hızlı yakınsama ve daha fazla kararlılık sağlayarak, transformatör ağırlıklı mimarilere kıyasla gerekli GPU azaltır.
Kenar Optimizasyonu: Dağıtım Odak Kaybını (DFL) ortadan kaldırarak, YOLO26 çıktı katmanını düzene sokar ve CPU %43'e varan hız artışı sağlar. Bu, GPU kullanılamadığı kenar cihazları için çok önemlidir.

YOLO26 Teknolojik Atılımlar

YOLO26 sadece bir sürüm artışı değil, kapsamlı bir yükseltmedir.

ProgLoss + STAL: Drone görüntüleme ve robotik için çok önemli olan küçük nesnelerin tanınmasını önemli ölçüde artıran geliştirilmiş kayıp fonksiyonları.
Çok yönlülük: Öncelikle bir dedektör olanYOLO farklı olarak, YOLO26 poz tahmini, segmentasyon, sınıflandırma ve OBB'yi destekler.

Kullanım Kolaylığı ve Ekosistem

YOLO gibi araştırma veri depolarının en büyük zorluklarından biri, kurulum ve bakımınınYOLO . Ultralytics , bu sorunu birleşik bir Python ile Ultralytics . İster YOLO11, YOLOv10 veya YOLO26 kullanıyor olun, iş akışı tutarlı ve basit kalır.

Ultralytics (eski adıyla HUB), veri kümesi yönetimi, otomatik açıklama ve TensorRT, ONNX ve CoreML gibi formatlara tek tıklamayla dışa aktarma araçları sağlayarak geliştirmeyi daha da hızlandırır.

YOLO26 hakkında daha fazla bilgi edinin

İdeal Kullanım Senaryoları

Doğru modeli seçmek, özel kısıtlamalarınıza bağlıdır:

YOLO seçin,YOLO : Nöral Mimari Arama (NAS) konusunda araştırma yapıyorsanız veya standart CSP/ELAN omurgalarının yetersiz kaldığı benzersiz donanım kısıtlamaları için özel bir backbone ihtiyacınız varsa.
YOLOv10 seçin: Akademik karşılaştırma için NMS belirli bir dedektöre ihtiyacınız YOLOv10 orijinal Tsinghua makalesinde önerilen belirli mimari için eski bir gereksiniminiz YOLOv10 .
Aşağıdaki durumlarda Ultralytics tercih edin: Üretime hazır, son teknoloji bir çözüme ihtiyacınız varsa. NMS tasarımı, MuSGD eğitim stabilitesi ve optimize edilmiş CPU ile bir araya gelerek onu en iyi çok yönlü çözüm haline getirir. Dağıtım kolaylığı ve uzun vadeli desteğin kritik öneme sahip olduğu üretim, perakende analitiği ve otonom sistemlerdeki gerçek zamanlı uygulamalar için özellikle üstündür.

Kod Örneği: YOLOv10 YOLO26'yı Çalıştırma

Ultralytics , bu mimariler arasında geçiş yapmayı inanılmaz derecede Ultralytics . YOLOv10 , Ultralytics içinde YOLOv10 için, her iki modeli de minimum kod değişikliği ile test edebilirsiniz.

YOLOv10 çalıştırma

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

YOLO26 Eğitimi

MuSGD optimizer ve ProgLoss gibi YOLO26'daki en son gelişmelerden yararlanmak için, özel bir veri seti üzerinde eğitim yapmak oldukça basittir:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset using the new optimizer settings (auto-configured)
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

Sonuç

HemYOLO YOLOv10 bu alanı ileriye YOLOv10 :YOLO verimli NASYOLO , YOLOv10 NMS vizyoner bir şekilde ortadan YOLOv10 . Ancak, 2026 yılında sağlam ve geleceğe dönük uygulamalar geliştirmek isteyen geliştiriciler için Ultralytics kesin bir avantaj sunmaktadır. YOLOv10 NMS mimarisini üstün eğitim dinamikleri, daha hızlı CPU ve Ultralytics eşsiz desteği YOLOv10 birleştiren YOLO26, bilgisayar görme uzmanları için en iyi seçimdir.

Önceki kararlı nesilleri keşfetmek isteyenler için, YOLO11 tamamen desteklenen ve yüksek performanslı bir alternatif olmaya devam etmektedir.