İçeriğe geç

YOLO11 - DAMO-YOLO Karşılaştırması: Teknik Bir İnceleme

Bilgisayarla görmenin hızla gelişen ortamında, doğru nesne algılama modelini seçmek proje başarısı için kritik öneme sahiptir. Bu sayfa, aşağıdakiler arasında ayrıntılı bir teknik karşılaştırma sunmaktadır Ultralytics YOLO11 ve YOLO, hız ve doğruluk için tasarlanmış iki yüksek performanslı mimaridir. YOLO akademik araştırmalardan yenilikçi teknikler sunarken, YOLO11 sağlam bir ekosistem tarafından desteklenen çok yönlü, üretime hazır bir çözüm olarak öne çıkıyor.

Yönetici Özeti

Ultralytics YOLO11YOLO serisindeki en son evrimi temsil eder ve uç cihazlardan bulut sunucularına kadar çeşitli donanımlarda gerçek zamanlı çıkarımı optimize eder. Algılama, segmentasyon ve poz tahmini dahil olmak üzere birden fazla görevi yerel olarak destekleyerek karmaşık yapay zeka işlem hatları için birleşik bir çözüm haline getirir.

Alibaba Group tarafından geliştirilen YOLO, Neural Architecture Search (NAS) ve yeni özellik füzyon tekniklerini kullanarak algılama hızı ve doğruluğunu dengelemeye odaklanmaktadır. Öncelikle GPU verimi için optimize edilmiş araştırma odaklı bir dedektördür.

Ultralytics YOLO11

Yazarlar: Glenn Jocher, Jing Qiu
Organizasyon:Ultralytics
Tarih: 2024-09-27
GitHubultralytics
Docsultralyticsyolo11

YOLO11 , yüksek verimliliği korurken özellik çıkarımını geliştiren mimari iyileştirmeler sunarak en son teknolojiyi geliştirir. Önceki nesillere kıyasla daha az parametre ile üstün doğruluk sağlamak için değiştirilmiş bir CSPNet backbone ve gelişmiş bir ankrajsız kafa kullanır.

Temel Özellikler ve Güçlü Yönler

  • Çok yönlülük: Birçok özel modelin aksine, YOLO11 çok görevli bir çerçevedir. Nesne algılama, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler.
  • Geliştirilmiş Mimari: Karmaşık desenleri etkili bir şekilde yakalamak için C3k2 bloklarını ve C2PSA (Uzamsal Dikkat ile Çapraz Aşamalı Kısmi) modüllerini içerir, küçük nesnelerde ve zor arka planlarda performansı artırır.
  • Geniş Donanım Desteği: Şunlar için optimize edilmiştir CPU ve GPU çıkarımı, Raspberry Pi 'den NVIDIA A100 kümelerine kadar değişen kısıtlamalara uyacak çeşitli model ölçekleri (Nano'dan X-Large'a) sunar.
  • Kullanım Kolaylığı: Ultralytics Python API ve CLI , geliştiricilerin modelleri minimum kodla eğitmesine, doğrulamasına ve dağıtmasına olanak tanır.

Üretime Hazır Ekosistem

YOLO11 , veri yönetimi araçları, Ultralytics HUB aracılığıyla model eğitimi ve aşağıdaki gibi formatlara tek tıklamayla dışa aktarma dahil olmak üzere Ultralytics ekosistemiyle sorunsuz bir şekilde entegre olur ONNX, TensorRTve CoreML.

YOLO11 hakkında daha fazla bilgi edinin

DAMO-YOLO

Yazarlar Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Organizasyon:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO

YOLO , endüstriyel uygulamalar için düşük gecikme süresi ve yüksek verim odaklı olarak tasarlanmıştır. YOLO ailesine, hız-doğruluk ödünleşimlerinin sınırlarını zorlamak için birkaç "yeni teknoloji" bileşeni ekler.

Mimari Yenilikler

  • MAE-NAS Backbone: Verimli bir ağ topolojisini otomatik olarak keşfetmek için Ortalama Mutlak Hata (MAE) tarafından yönlendirilen Sinir Mimarisi Aramasını (NAS) kullanır.
  • Verimli RepGFPN: Yeniden parametrelendirme kullanan bir Genelleştirilmiş Özellik Piramidi Ağı (GFPN), eğitim sırasında karmaşık özellik füzyonuna izin verirken, çıkarım sırasında daha hızlı, daha basit bir yapıya daralır.
  • ZeroHead: Sınıflandırma ve regresyon görevlerini birbirinden ayırarak son çıktı katmanlarının hesaplama yükünü önemli ölçüde azaltan hafif bir algılama kafası.
  • AlignedOTA: Eğitim sırasında sınıflandırma güveni ve regresyon doğruluğu arasındaki uyumsuzluğu çözen gelişmiş bir etiket atama stratejisi.

YOLO belirli metriklerde üstün olsa da, öncelikle bir araştırma deposudur. Ultralytics ekosisteminde bulunan kapsamlı dokümantasyon, sürekli güncellemeler ve geniş topluluk desteğinden yoksundur.

DAMO-YOLO hakkında daha fazla bilgi edinin

Performans Ölçütleri: Kafa Kafaya

Aşağıdaki tabloda YOLO11 ve YOLO 'nun COCO val2017 veri kümesi üzerindeki performansı karşılaştırılmaktadır. Temel ölçütler arasında CPU ve GPU donanımlarında Ortalama Ortalama HassasiyetmAP) ve çıkarım hızı yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Sonuçların Analizi

  1. Verimlilik Üstünlüğü: YOLO11 üstün parametre verimliliği göstermektedir. Örneğin, YOLO11m modeli sadece 20,1 milyon parametre ile 51,5 mAP elde ederken, karşılaştırılabilir DAMO-YOLOm 28,2 milyon parametrelik daha büyük bir ayak izi ile 49,2 mAP 'de geride kalmaktadır.
  2. Üstün Doğruluk: En büyük varyant olan YOLO11x, listelenen en büyük YOLO modelini geride bırakarak 54,7 mAP'ye ulaşır. Bu, YOLO11 'i tıbbi görüntüleme veya kusur tespiti gibi yüksek hassasiyetli görevler için tercih edilebilir bir seçenek haline getirir.
  3. Kenar Dağıtım: YOLO11n (Nano) modeli son derece hafif (2,6M parametre) ve hızlıdır (T4'te 1,5 ms), bu da onu belleğin az olduğu gömülü sistemler için mükemmel kılar. Buna karşılık, en küçük YOLO modeli önemli ölçüde daha ağırdır (8,5 milyon parametre).
  4. CPU Performansı: Ultralytics , YOLO11'in özel hızlandırıcılar olmadan dağıtımlar için uygulanabilirliğini vurgulayan şeffaf CPU kıyaslamaları sağlar. YOLO , CPU hızlarını resmi olarak bildirmez, bu da düşük güçlü IoT uygulamaları için değerlendirmesini sınırlar.

Teknik Derin Dalış

Eğitim ve Mimarlık

YOLO , backbone tanımlamak için büyük ölçüde Sinirsel Mimari Aramasına (NAS) dayanır. Bu, teorik olarak en uygun yapıları sağlayabilse de, genellikle tüm cihazlarda donanım dostu olmayabilecek düzensiz bloklarla sonuçlanır. Buna karşılık, YOLO11 , el yapımı, rafine edilmiş bloklar (C3k2, C2PSA) kullanır ve bunlar sezgisel olarak standart GPU ve CPU hızlandırma kütüphaneleri.

YOLO11 ayrıca eğitim verimliliğini de vurgulamaktadır. Optimize edilmiş hiperparametreler ve veri artırma stratejileri sayesinde hızlı bir şekilde yakınsar. Eğitim sırasındaki bellek gereksinimleri genellikle karmaşık transformatör tabanlı veya NAS tabanlı mimarilerden daha düşüktür ve araştırmacıların tüketici sınıfı donanımlarda etkili modeller eğitmesine olanak tanır.

Ekosistem ve Kullanılabilirlik

En önemli farklılaştırıcılardan biri ekosistemdir. YOLO öncelikle araştırma makalesi sonuçlarını yeniden üretmek için bir kod deposudur.

Ultralytics YOLO11 ise tam hizmet veren bir platformdur:

  • Dokümantasyon: Boru hattının her yönüyle ilgili kapsamlı kılavuzlar.
  • Entegrasyonlar: MLFlow, TensorBoard için yerel destek ve Weights & Biases deney takibi için.
  • Topluluk: GitHub ve Discord'da hataların hızla düzeltilmesini ve soruların yanıtlanmasını sağlayan devasa, aktif bir topluluk.
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

Kullanım Örneği Önerileri

Ultralytics YOLO11 Ne Zaman Seçilir

  • Gerçek Dünya Dağıtımı: Farklı donanımlar üzerinde dağıtım yapmanız gerekiyorsa (iOS, Android, Edge TPU, Jetson), YOLO11'in ihracat yetenekleri eşsizdir.
  • Karmaşık Görüntü İşlem Hatları: Projeniz, nesneleri izlemek veya vücut duruşunutahmin etmek gibi sınırlayıcı kutulardan daha fazlasını gerektirdiğinde, YOLO11 bunları yerel olarak ele alır.
  • Hızlı Prototipleme: Kullanım kolaylığı, geliştiricilerin verilerden dakikalar içinde çalışan bir demoya geçmesine olanak tanır.
  • Kaynak Kısıtlamaları: Nano ve Küçük modeller, pille çalışan cihazlar için en iyi doğruluk-boyut oranını sunar.

DAMO-YOLO'yu Ne Zaman Düşünmeli

  • Akademik Araştırma: Nesne algılama veya yeniden parametrelendirme tekniklerinde NAS'ın etkinliğini inceleyen araştırmacılar YOLO 'yu değerli bir temel olarak bulabilirler.
  • Belirli GPU Kurulumları: YOLO 'nun belirli mimari bloklarının hedef hızlandırıcının önbellek hiyerarşisiyle mükemmel bir şekilde hizalandığı senaryolarda, rekabetçi bir verim sunabilir.

Sonuç

YOLO , MAE-NAS ve RepGFPN gibi etkileyici akademik kavramları tanıtırken, Ultralytics YOLO11 geliştiricilerin ve işletmelerin büyük çoğunluğu için üstün bir seçim olmaya devam ediyor. Son teknoloji ürünü doğruluk, hafif mimari ve gelişen bir ekosistemin birleşimi, projelerin yalnızca performanslı değil, aynı zamanda sürdürülebilir ve ölçeklenebilir olmasını sağlar.

Güvenilir, çok yönlü ve yüksek performanslı bir bilgisayarla görme çözümü arayan geliştiriciler için YOLO11 , 2025 ve sonrasında başarılı olmak için gerekli araçları ve ölçümleri sunar.

Diğer Model Karşılaştırmalarını İnceleyin

Nesne algılama modellerinin manzarasını daha iyi anlamak için bu ilgili karşılaştırmaları inceleyin:


Yorumlar