İçeriğe geç

YOLO11 YOLO: Gerçek Zamanlı Nesne Algılama Mimarilerinin Evrimi

Bilgisayar görme araştırmaları, hız ve doğruluğun sınırlarını sürekli yeniden tanımlayan yeni mimarilerle birlikte, baş döndürücü bir hızla ilerlemektedir. Bu alana yapılan iki önemli katkı şunlardır YOLO11Ultralytics Group'un YOLO. Her iki model de gerçek zamanlı nesne algılama sorununu çözmeyi amaçlasa da, bu konuya farklı felsefelerle yaklaşmaktadırlar: biri kesintisiz kullanılabilirlik ve dağıtım üzerine odaklanırken, diğeri titiz sinir mimarisi araştırması (NAS) ve akademik keşif üzerine odaklanmaktadır.

Bu kılavuz, geliştiricilerin, araştırmacıların ve mühendislerin belirli bilgisayar görme uygulamaları için doğru aracı seçmelerine yardımcı olmak amacıyla kapsamlı bir teknik karşılaştırma sunmaktadır.

Model Genel Bakışları

YOLO11

YOLO11 , YOLO You Only Look Once) ailesinde yıllarca süren tekrarlanan iyileştirmelerin sonucudur. 2024 yılının sonlarında Ultralytics tarafından piyasaya sürülen bu ürün, YOLOv8 'nin başarısını temel alarak, "bag-of-freebies" felsefesini korurken özellik çıkarma verimliliğini artıran mimari iyileştirmeler sunar ve karmaşık eğitim kurulumları gerektirmeden yüksek performans sağlar.

YOLO11 hakkında daha fazla bilgi edinin

DAMO-YOLO

YOLO, DAMO Academy (Alibaba Group) tarafından geliştirilen araştırma odaklı bir modeldir. backbone için Sinir Mimarisi Arama (NAS), verimli Yeniden Parametreleştirilmiş Genelleştirilmiş FPN (RepGFPN) ve damıtma tabanlı bir eğitim çerçevesi dahil olmak üzere birçok yeni teknolojiyi tanıtmaktadır. Otomatik tasarım arama yoluyla gecikme ve doğruluk arasındaki dengeyi en üst düzeye çıkarmaya odaklanmaktadır.

Teknik Karşılaştırma

Mimari ve Tasarım Felsefesi

Bu iki model arasındaki temel fark, tasarımlarının kökenlerinde yatmaktadır. YOLO11 çok yönlülük ve kullanım kolaylığı için el yapımıdır. Rafine edilmiş bir C3k2 (Cross Stage Partial) backbone parametre sayısını özellik temsilini dengeleyen geliştirilmiş bir detect kullanır. Bu tasarım, modelin sadece nesne algılama değil, aynı zamanda örnek segmentasyonu, poz tahmini, sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) görevleri gibi çok çeşitli görevlerde de sağlam olmasını sağlar.

Buna karşılık, YOLO, backbone keşfetmek için MAE-NAS (Otomatik Verimli Sinir Mimarisi Arama Yöntemi) kullanır. Bu, belirli donanım kısıtlamaları için teorik olarak optimal olan, ancak opak ve manuel olarak değiştirilmesi zor bir ağ topolojisi ile sonuçlanır. Ek olarak,YOLO , "ZeroHead" tasarımı ve daha büyük öğretmen modellerinden damıtma içeren karmaşık bir eğitim boru hattına büyük ölçüdeYOLO , bu da özel veri kümeleri üzerinde eğitimin karmaşıklığını artırır.

Performans Metrikleri

Aşağıdaki tablo, çeşitli model ölçeklerinin performanslarını karşılaştırmaktadır. YOLO11 , özellikle düşük gecikmeli senaryolarda (N/S/M modelleri) üstün verimlilik YOLO11 , aynı zamanda en son teknolojiye sahip doğruluğu da korumaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Performans Analizi

YOLO11 eşdeğerYOLO kıyasla daha az parametre ile tutarlı bir şekilde daha yüksek mAP elde eder. Örneğin, YOLO11s mAP neredeyse %40 daha az parametre mAP (9,4 milyon karşı 16,3 milyon) DAMO-YOLO'lardan 1,0 mAP daha yüksek performans gösterir. Bu verimlilik, doğrudan daha düşük bellek kullanımı ve uç cihazlarda daha hızlı çıkarım anlamına gelir.

Eğitim Verimliliği ve Kullanılabilirlik

YOLO11 erişilebilirliği ile öne çıkıyor. En yeni teknolojiye sahip ultralytics Python ile model eğitimi, veri kümesi YAML dosyasını tanımlamak ve tek bir komut çalıştırmak kadar basittir. Ekosistem, hiperparametre ayarlaması, veri artırımı ve deney takibi otomatik olarak.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with one line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Tersine, YOLO çok aşamalı bir eğitim süreci kullanır. Genellikle, bilgileri daha küçük "öğrenci" modeline aktarmak için önce ağır bir "öğretmen" modelinin eğitilmesi gerekir. Bu, eğitim için gereken GPU süresini ve VRAM'ı önemli ölçüde artırır. Akademik benchmarklar için doğruluğun son kısmını sıkıştırmak için etkili olsa da, bu karmaşıklık çevik mühendislik ekipleri için bir darboğaz oluşturabilir.

İdeal Kullanım Senaryoları

Neden Ultralytics Modellerini Seçmelisiniz?

Gerçek dünyadaki uygulamaların büyük çoğunluğu için, YOLO11 (ve daha yeni olan YOLO26) performans ve pratiklik arasında en iyi dengeyi sunar.

  • Kullanım Kolaylığı: Ultralytics , geliştiricilerin memnuniyeti için tasarlanmıştır. Kapsamlı kılavuzlar ve birleşik CLI , prototipten üretime geçişi CLI .
  • İyi Bakımlı Ekosistem: Yayınlandıktan sonra atıl hale gelen birçok araştırma deposunun aksine, Ultralytics aktif olarak bakımdan geçirilir. Düzenli güncellemeler, en son sürümlerle uyumluluğu sağlar. PyTorch sürümleri, CUDA ve OpenVINO ve CoreMLgibi dışa aktarım formatları.
  • Çok yönlülük:YOLO tamamen bir nesne algılayıcıYOLO , YOLO11 doğal olarak Poz Tahmini (anahtar noktalar) ve Örnek Segmentasyonu'nu YOLO11 . Bu, tek bir mimari ailesinin karmaşık iş akışlarında çeşitli görme görevlerini yerine getirmesini sağlar.
  • Bellek Verimliliği: Ultralytics YOLO , düşük VRAM kullanımı için optimize edilmiştir. Transformatör tabanlı mimariler veya karmaşık damıtma boru hatlarıyla sıklıkla ilişkili olan ağır bellek yükünü önlerler, böylece tüketici sınıfı donanımlarda eğitilebilirler.

DAMO-YOLO Ne Zaman Kullanılmalı

  • Akademik Araştırma: Amacınız, YOLO sunulan Sinir Mimarisi Arama (NAS) veya belirli rep-parametrizasyon tekniklerinin yeniden üretilmesini incelemekse.
  • Özel Donanım Kısıtlamaları: Çok özel, standart olmayan bir donanım hızlandırıcısına backbone uyarlanmış bir backbone bulmak için kapsamlı NAS aramaları yapmak için gerekli kaynaklara sahipseniz.

Gerçek Dünya Uygulamaları

YOLO11 sağlamlığı nedeniyle birçok sektörde yaygın olarak kullanılmaktadır:

  • Akıllı Perakende: Nesne algılama kullanarakmüşteri davranışını analiz etme ve otomatik envanter yönetimi.
  • Sağlık hizmetleri: Hızın hızlı tarama imkanı sağladığı tıbbi görüntülemedetümör tespiti.
  • Üretim: Montaj hatlarındaki detect için uç cihazlarda yüksek hızlı çıkarım gerektirenkalite kontrol sistemleri.

İleriye Doğru: YOLO26 Avantajı

YOLO11 mükemmel bir model YOLO11 da, bu alanda gelişmeler devam etmektedir. 2026 yılında başlayacak yeni projeler için YOLO26 önerilen seçimdir.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, birkaç çığır açan özellik sunar:

  • Uçtan Uca NMS: Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak, YOLO26 dağıtım mantığını basitleştirir ve gecikme değişkenliğini azaltır. Bu kavram, YOLOv10.
  • MuSGD Optimizer: LLM eğitiminden esinlenerek geliştirilmiş, istikrarlı yakınsama sağlayan hibrit bir optimizer.
  • Geliştirilmiş Küçük Nesne Algılama: ProgLoss ve STAL gibi kayıp fonksiyonları, drone görüntüleri ve IoT sensörleri için çok önemli olan küçük hedeflerde performansı önemli ölçüde artırır.

Sonuç

Her ikisi de YOLO11 ve YOLO, nesne algılamanın gelişmesine önemli katkılar sağlamıştır.YOLO , otomatik mimari aramanın potansiyeliniYOLO . Ancak, YOLO11 , basitleştirilmiş iş akışı, kapsamlı görev desteği ve verimli parametre kullanımı nedeniyle pratik uygulamalar için en iyi seçenek olmaya devam etmektedir.

En son teknolojileri takip etmek isteyen geliştiriciler için YOLO26' ya geçiş, daha da yüksek hız ve basitlik sunarak bilgisayar görme projelerinizin geleceğe hazır olmasını sağlar.

Projenizi Başlatın

Eğitime başlamaya hazır mısınız? Ultralytics ziyaret ederek, karmaşık altyapıyı yönetmenize gerek kalmadan modellerinizi dakikalar içinde açıklama ekleyin, eğitin ve dağıtın.


Yorumlar