YOLOv10 YOLO11: Akademik İnovasyon ile Gerçek Dünya Ölçeği Arasındaki Köprü

Gerçek zamanlı nesne algılamanın evrimi, hız, doğruluk ve mimari verimlilik alanlarında hızlı ilerlemelerle dikkat çekmiştir. Bu yakın tarihin iki önemli aktörü şunlardır YOLOv10 ve YOLO11'dir. Her iki model de bilgisayar görüşü ile mümkün olanın sınırlarını zorlarken, farklı tasarım felsefelerinden kaynaklanmakta ve AI topluluğu içinde farklı ihtiyaçları hedeflemektedir. Bu karşılaştırma, geliştiricilerin özel gereksinimlerine uygun doğru aracı seçmelerine yardımcı olmak için her iki modelin teknik özelliklerini, mimari farklılıklarını ve pratik uygulamalarını incelemektedir.

YOLOv10: Uçtan Uca Algılamanın Akademik Öncüleri

Tsinghua Üniversitesi araştırmacıları tarafından Mayıs 2024'te yayınlanan YOLOv10, NMS bir eğitim stratejisine odaklanarak YOLO bir paradigma değişikliği getirdi. Tarihsel olarak, YOLO , çıkarım sırasında çakışan sınırlayıcı kutuları filtrelemek için Non-Maximum Suppression (NMS) yöntemine dayanıyordu. Etkili olmasına rağmen, NMS , dağıtım gecikmesinde bir darboğaz NMS ve TensorRT veya ONNX gibi formatlara dışa aktarma sürecini karmaşıklaştırır.

Temel Mimari Yenilikler

YOLOv10 , eğitim sırasında çift atama stratejisiyle bu zorlukları YOLOv10 . Öğrenme sırasında zengin denetim için birden çok başlık ve çıkarım için bire bir başlık kullanarak, modelin nesne başına tek bir en iyi kutuyu doğrudan tahmin etmesini sağlar. Bu, NMS olan ihtiyacı ortadan kaldırarak, uç cihazlardaki gecikmeyi önemli ölçüde azaltır.

Ek olarak, YOLOv10 , Bütünsel Verimlilik-Doğruluk Odaklı Model Tasarımı'nı YOLOv10 . Bu, hafif sınıflandırma başlıkları, uzamsal kanal ayrıştırılmış aşağı örnekleme ve sıralama kılavuzlu blok tasarımını içerir ve bunlar birlikte hesaplama fazlalığını azaltır.

Teknik Meta Veriler:

Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
Kuruluş:Tsinghua Üniversitesi
Tarih: 2024-05-23
Arxiv:YOLOv10: Gerçek Zamanlı Uçtan Uca Nesne Tespiti
GitHub:THU-MIG/yolov10

YOLOv10 hakkında daha fazla bilgi edinin.

Ultralytics YOLO11: Kurumsal Ölçek için İyileştirildi

Eylül 2024'te piyasaya sürülen Ultralytics YOLO11 , sağlam bir çerçeve üzerine kurulmuştur. YOLOv8 ve YOLOv9'nin sağlam çerçevesine dayanmaktadır. Geleneksel NMS yaklaşımı korurken (yerel olarak uçtan uca YOLOv10 farklı olarak), YOLO11 özellik çıkarma verimliliği ve parametre optimizasyonuna büyük YOLO11 . Bilgisayar görüşünün "İsviçre çakısı" olarak tasarlanmış olup, yalnızca algılama konusunda değil, örnek segmentasyonu, poz tahmini, sınıflandırma ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama dahil olmak üzere çok çeşitli görevlerde de mükemmeldir.

YOLO11'deki gelişmeler

YOLO11 rafine edilmiş bir backbone mimari (C3k2) sunuyor. Bu, modelin karmaşık sahnelerdeki (örneğin hava görüntülerindeki küçük nesneler gibi) karmaşık ayrıntıları önceki modellerden daha etkili bir şekilde yakalamasını sağlıyor. Ayrıca, Ultralytics entegrasyonu, NVIDIA 'dan temel CPU'lara kadar çeşitli donanım platformlarında eğitim, doğrulama ve dağıtım için kesintisiz destek sağlıyor.

Teknik Meta Veriler:

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
Belgeler:YOLO11 Dökümantasyonu
GitHub:ultralytics/ultralytics

YOLO11 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Performansı karşılaştırırken, ham mAP ötesine bakmak ve hız, model boyutu (parametreler) ve hesaplama maliyeti (FLOP'lar) arasındaki dengeleri göz önünde bulundurmak çok önemlidir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

Verileri Analiz Etme

YOLOv10 YOLOv10 bazı yapılandırmalarda (örneğin 'M' modeli) daha düşük parametre sayılarına sahip olsa da, YOLO11 sıklıkla daha yüksek mAP puanları ve T4 GPU'larda rekabetçi veya üstün çıkarım hızları elde eder ve backbone etkinliğini gösterir.

İdeal Kullanım Senaryoları

YOLOv10 Ne Zaman Tercih Edilmeli?

YOLOv10 , gecikmeyi azaltmak için NMS kaldırılmasının kritik olduğu araştırma odaklı projeler veya belirli uç dağıtım senaryoları için mükemmel bir YOLOv10 . Uçtan uca mimarisi, son işlem mantığının verimli bir şekilde uygulanmasının zor olduğu belirli gömülü sistemler için dışa aktarım sürecini basitleştirir.

Gömülü Sistemler: Son işlem için sınırlı CPU sahip cihazlar.
Akademik Araştırma: NMS mimariler ve çift atama eğitim stratejileri üzerine çalışma.
Gecikme Süresi Kritik Uygulamalar: Her milisaniyenin önemli olduğu yüksek hızlı robotik uygulamalar.

Ultralytics YOLO11 Ne Zaman Seçilir

YOLO11 , yüksek doğruluk, çok yönlülük ve kullanım kolaylığı arasında denge gerektiren üretim düzeyindeki uygulamalar için tercih edilen YOLO11 . Ultralytics tarafından desteklenen bu çözüm, veri etiketlemeden model izlemeye kadar akıcı bir iş akışı sunar.

Kurumsal Çözümler: Güvenilir, bakımlı kod tabanları ve ticari lisanslama gerektiren büyük ölçekli dağıtımlar.
Karmaşık Görme Görevleri: Algılama ile birlikte poz tahmini veya segmentasyon gerektiren projeler.
Bulut Eğitimi: Veri kümelerini ve eğitim çalıştırmalarını yönetmek için Ultralytics ile sorunsuz entegrasyon.
Çok yönlülük: Sınıflandırma, algılama ve segmentasyonu tek bir API ile gerçekleştirmek için tek bir çerçeveye ihtiyaç duyan geliştiriciler.

Ultralytics Ekosisteminin Avantajı

YOLO11'in en önemli farklılıklarından biri YOLO11 YOLO11'in en önemli ayırt edici özelliklerinden biri, onu çevreleyen ekosistemdir. YOLOv10 etkileyici bir akademik katkı YOLOv10 da, YOLO11 sürekli güncellemeler, kapsamlı belgeler ve Ultralytics gibi araçlarla sıkı entegrasyon gibi YOLO11

Kullanım Kolaylığı: Basit bir Python , sadece birkaç satır kodla model eğitimi yapılmasına olanak tanır.
Bellek Verimliliği: Ultralytics , birçok Transformer tabanlı alternatife kıyasla eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir, bu da onları tüketici sınıfı GPU'larda erişilebilir hale getirir.
Geniş Uyumluluk: YOLO11 CoreML, OpenVINO, TensorRTve daha fazlasını tek bir komutla.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Geleceğe Bakış: YOLO26 ile Gelecek

YOLOv10 YOLO11 önemli kilometre taşları YOLO11 da, bu alan hızla gelişmektedir. En son teknolojileri arayan geliştiriciler için YOLO26 (Ocak 2026'da piyasaya sürüldü) her iki dünyanın en iyilerini bir araya getiriyor.

YOLO26, YOLOv10 tarafından öncülüğünü yaptığı NMS uçtan uca tasarımı benimser, YOLOv10 Ultralytics kurumsal ölçek için geliştirdiği özgün optimizasyon ile bu tasarımı daha da iyileştirir. Daha basit dışa aktarımlar için DFL (Dağıtım Odak Kaybı) kaldırma özelliğine ve istikrarlı, LLM'den ilham alan eğitim yakınsaması için yenilikçi MuSGD optimizasyon aracına sahiptir. Önceki nesillere göre %43'e kadar daha hızlı CPU ve ProgLoss + STAL gibi geliştirilmiş kayıp işlevlerine sahip olan YOLO26, modern bilgisayar görme projeleri için en iyi seçimdir.

YOLO26 hakkında daha fazla bilgi edinin

Diğer özel mimarilerle ilgilenen kullanıcılar için, belgeler ayrıca şunları da kapsamaktadır RT-DETR ve açık sözlük görevleri için YOLO de ele almaktadır.