YOLO . YOLO11: Gerçek Zamanlı Nesne Algılamaya Derinlemesine Bir Bakış

Nesne algılama alanı sürekli olarak gelişmekte olup, araştırmacılar ve mühendisler doğruluk, çıkarım hızı ve hesaplama verimliliği gibi birbiriyle çelişen talepler arasında denge kurmaya çalışmaktadır. Bu alanda ortaya çıkan iki önemli mimari, Alibaba Group tarafından geliştirilenYOLO ve YOLO11, Ultralytics'in güçlü bir yinelemesidir.

YOLO , Sinir Mimarisi Arama (NAS) ve yoğun yeniden parametreleştirme alanlarında yeni kavramlarYOLO , YOLO11 üretim hazırlığı ve çok yönlülüğe odaklanan, kullanıcı merkezli, rafine bir yaklaşımı YOLO11 . Bu karşılaştırma, her iki modelin mimari nüanslarını, performans ölçütlerini ve pratik uygulama hususlarını inceliyor.

DAMO-YOLO'ya Genel Bakış

YOLO Alibaba'nın DAMO Akademisi'ndeki araştırmacılar tarafından önerilen yüksek performanslı bir nesneYOLO . Neural Architecture Search (NAS) teknolojisini kullanarak belirli kısıtlamalara göre otomatik olarak verimli omurgalar tasarlayarak kendini diğerlerinden ayırır.

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO

Mimari, özellik füzyonu için özel bir RepGFPN (Reparameterized Generalized Feature Pyramid Network) ve "ZeroHead" olarak adlandırılan hafif bir başlık entegre eder. Eğitim stratejisinin temel bileşeni, sınıflandırma ve regresyon görevleri arasındaki uyumsuzluk sorunlarını çözmek için tasarlanmış dinamik bir etiket atama yöntemi olan "AlignedOTA"dır. Ayrıca, daha küçük varyantların performansını artırmak için daha büyük "öğretmen" modellerinden damıtmaya büyük ölçüde dayanır.

YOLO11

YOLO11 , Ultralytics YOLO mirasını YOLO11 , parametre verimliliğini en üst düzeye çıkarmak için CSP (Cross Stage Partial) ağ tasarımını geliştirmiştir. Karmaşık kurulumlar gerektiren araştırma odaklı modellerin aksine, YOLO11 gerçek dünyada hemen kullanılmak üzere YOLO11 "batarya dahil" bir deneyim sunar.

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
Belgeler:https://docs.ultralytics.com/models/YOLO11/
GitHub:https://github.com/ultralytics/ultralytics

YOLO11 , C3k2 blok tasarımını YOLO11 ve küresel bağlamı daha iyi yakalamak için C2PSA (Cross Stage Partial with Spatial Attention) modülleri sunar. Ultralytics tamamen entegre olup, CPU'lar, GPU'lar ve uç cihazlar dahil olmak üzere çeşitli donanımlarda kesintisiz eğitim, doğrulama ve dağıtımı destekler.

YOLO11 hakkında daha fazla bilgi edinin

Teknik Karşılaştırma

Aşağıdaki tablo, modeller arasındaki performans farklarını göstermektedir.YOLO güçlü bir teorik performansYOLO , YOLO11 özellikle dışa aktarma ve dağıtım yükü göz önüne alındığında, pratik senaryolarda hız ve doğruluk açısından YOLO11 daha dengeli bir profil sunar.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

Mimarlık ve Eğitim Metodolojileri

YOLO, belirli gecikme kısıtlamaları altında en uygun backbone keşfetmek için MAE-NAS (Masked Autoencoder Neural Architecture Search) kullanır. Bu, teorik olarak verimli ancak orijinal NAS boru hattı olmadan değiştirilmesi veya ince ayar yapılması zor olan modellerle sonuçlanır. Eğitim süreci karmaşıktır ve genellikle, bilgileri daha küçük hedef modele aktarmak için önce ağır bir öğretmen modelinin eğitildiği iki aşamalı bir yaklaşım gerektirir.

YOLO11ise, derinlik, genişlik ve çözünürlüğü dengeleyen, el yapımı ancak yüksek düzeyde optimize edilmiş bir mimari kullanır. Eğitim süreci, yardımcı öğretmen modelleri veya karmaşık damıtma aşamaları gerektirmeyen standart artırma ve kayıp fonksiyonları kullanılarak basitleştirilmiştir. Bu, YOLO11 derin alan uzmanlığı olmadan özel veri kümeleri üzerinde eğitilmesini YOLO11 kolaylaştırır.

Uyarı: Karmaşıklık ve Kullanılabilirlik

YOLO NAS tabanlı yaklaşımı matematiksel olarak optimal yapılar üretirken, Ultralytics kullanılabilirliği önceliklendirir. YOLO11 gibi bir model tek bir CLI YOLO11 . yolo train, oysa araştırma veri depoları genellikle karmaşık yapılandırma dosyaları ve çok adımlı hazırlık gerektirir.

Ultralytics'in Avantajı

Model seçimi, ham mAP ötesine geçer; makine öğrenimi projesinin tüm yaşam döngüsünü kapsar. YOLO11ve son teknoloji YOLO26gibi Ultralytics , geliştirmeyi basitleştiren belirgin avantajlar sunar.

Eşsiz Kullanım Kolaylığı ve Ekosistem

Ultralytics , sürtünmeyi azaltmak için tasarlanmıştır. YOLO11 eğitmek için minimum kod gerekir ve Python tüm model sürümlerinde tutarlıdır. Bu, kullanıcıların genellikle sağlam belgelere veya uzun vadeli bakıma sahip olmayan araştırma düzeyinde bir kod tabanında gezinmek zorunda kaldıklarıYOLO ile tezat oluşturur.

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single line
results = model.train(data="coco8.yaml", epochs=100)

Ayrıca, Ultralytics veri kümesi yönetimi, etiketleme ve bulut eğitimi için sorunsuz bir arayüz sunarak, gelişmiş bilgisayar görme yeteneklerine erişimi etkili bir şekilde demokratikleştirir.

Görevler Arası Çok Yönlülük

Ultralytics benimsemek için en güçlü argümanlardan biri çok yönlülüktür.YOLO öncelikle bir nesne algılayıcıYOLO da, YOLO11 aynı kod tabanında çok çeşitli bilgisayar görme görevlerini YOLO11 :

Örnek Segmentasyonu: Nesnelerin hassas maskelenmesi.
Poz Tahmini: İnsan iskeletini izlemek için kilit noktaları tespit etme.
Yönlendirilmiş Sınır Kutusu (OBB): Hava görüntüleri ve açılı nesneler için idealdir.
Sınıflandırma: Tam görüntü kategorizasyonu.

Performans Dengesi ve Bellek Verimliliği

Ultralytics , kaynakları verimli kullanmalarıyla tanınır. YOLO11 , transformatör ağırlıklı mimarilere veya karmaşık NAS türevli modellere kıyasla, eğitim sırasında YOLO11 daha az CUDA gerektirir. Bu, geliştiricilerin tüketici sınıfı GPU'larda daha büyük partileri eğitmelerine olanak tanıyarak yineleme döngüsünü hızlandırır.

Çıkarım için, YOLO11 aşağıdaki formatlara aktarım için optimize edilmiştir ONNX, TensorRTve CoreML gibi formatlara dışa aktarılmak üzere optimize edilmiştir. Bu, benchmarklarda görülen yüksek doğruluğun, NVIDIA modüllerinden Raspberry Pi'lere kadar uç cihazlarda gerçek zamanlı performansa dönüşmesini sağlar.

İleriye Bakış: YOLO26'nın Gücü

En üst düzey performansı arayan geliştiriciler için Ultralytics , YOLO26'yı piyasaya Ultralytics . Bu yeni nesil model, devrim niteliğindeki YOLO11 yerini alıyor:

Uçtan Uca NMS Tasarım: YOLO26, Non-Maximum Suppression (NMS) son işlemlerini ortadan kaldırır. Bu yerel uçtan uca yaklaşım, dağıtım süreçlerini basitleştirir ve gecikme varyansını azaltır. Bu özellik ilk olarak YOLOv10'de ilk kez keşfedilen bir özelliktir.
MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitimindeki yeniliklerden (Moonshot AI'nın Kimi K2 gibi) ilham alan YOLO26, daha hızlı yakınsama ve daha fazla eğitim kararlılığı için MuSGD optimizer'ı kullanır.
Edge-First Optimizasyonu: Dağıtım Odaklı Kayıp (DFL) ve belirli CPU kaldırılmasıyla YOLO26, CPU'larda %43'e varan daha hızlı çıkarım elde ederek, uç bilgi işlem için üstün bir seçim haline gelmiştir.
ProgLoss + STAL: Yeni kayıp fonksiyonları, drone ve IoT uygulamaları için kritik bir özellik olan küçük nesne algılamayı iyileştirir.

YOLO26 hakkında daha fazla bilgi edinin

İdeal Kullanım Senaryoları

YOLO seçinYOLO Görme omurgalarında NAS'ın etkinliğini araştıran bir araştırmacıysanız veya özel olarak aranan bir mimari gerektiren oldukça spesifik bir donanım kısıtlamanız varsa ve karmaşık bir damıtma boru hattını yönetmek için gerekli kaynaklara sahipseniz.
YOLO11 seçin: Hız ve doğruluğu olağanüstü bir şekilde dengeleyen, sağlam, genel amaçlı bir dedektöre ihtiyacınız YOLO11 . İzleme, özel veriler üzerinde kolay eğitim ve geniş platform uyumluluğu gerektiren ticari uygulamalar için idealdir.
YOLO26'yı seçin: Özellikle uç CPU'larda mümkün olan en yüksek çıkarım hızlarına ihtiyacınız varsa veya NMS kaldırarak dağıtım yığınınızı basitleştirmeniz gerekiyorsa. En son teknoloji verimlilik ve çok yönlülük gerektiren yeni projeler için önerilen seçimdir.

Sonuç

HemYOLO YOLO11 , bilgisayar görme alanına önemli katkılar YOLO11 .YOLO , otomatik mimari aramanın potansiyeliniYOLO , YOLO11 ise kullanılabilirlik ve ekosistem desteğine odaklanarak derin öğrenmenin pratik uygulamasını YOLO11 .

Çoğu geliştirici ve işletme için, Ultralytics ekosistemi, YOLO11 son teknoloji YOLO26ile değer elde etmenin en doğrudan yolunu sunar. Kapsamlı belgeler, aktif topluluk desteği ve Ultralytics gibi araçlar sayesinde kullanıcılar, konsept aşamasından uygulamaya güvenle ve hızla geçebilirler.

Diğer mimarilerle ilgilenenler için Ultralytics , aşağıdaki modellerle karşılaştırmalar da sunmaktadır RT-DETR (Real-Time DEtection TRansformer) ve YOLOv9gibi modellerle karşılaştırmalar sunarak, görsel yapay zeka ihtiyaçlarınıza uygun aracı seçerken tam bir resim elde etmenizi sağlar.