DAMO-YOLO ve YOLOv5: Gerçek Zamanlı Nesne Algılamaya Derinlemesine Bir Bakış

Bilgisayarlı görü evrimi, gerçek zamanlı nesne algılamadaki sürekli yeniliklerle şekillenmiştir. Günümüzde geliştiriciler ve araştırmacılar, görü hatlarını tasarlarken sayısız mimari seçenekle karşı karşıyadır. Bu kapsamlı teknik karşılaştırma, DAMO-YOLO ve Ultralytics YOLOv5 arasındaki nüansları keşfederek; bunların mimarilerini, eğitim metodolojilerini, performans metriklerini ve ideal dağıtım senaryolarını öne çıkarıyor.

DAMO-YOLO'ya Giriş

Alibaba Group tarafından yayınlanan DAMO-YOLO, algılama hızı ve doğruluğunun sınırlarını zorlamayı amaçlayan birkaç yeni teknik sundu.

DAMO-YOLO hakkında daha fazla bilgi edinin

Mimari Yenilikler

DAMO-YOLO, Sinir Mimarisi Araması (NAS) temel üzerine kuruludur. Yazarlar, gecikme ve doğruluk arasında denge kuran omurgaları otomatik olarak tasarlamak için MAE-NAS kullanmışlardır. Model, farklı ölçeklerde özellik füzyonunu iyileştiren verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) sunar. Ayrıca DAMO-YOLO, çıkarım sırasında büyük ölçüde yeniden parametrelendirmeye dayanan daha basit, daha verimli bir yapı lehine karmaşık çok dallı tahmin başlıklarını ortadan kaldıran bir "ZeroHead" tasarımı içerir.

Eğitimi iyileştirmek için model, etiket ataması için AlignedOTA ve daha büyük bir "öğretmen" modelinin daha yüksek doğruluk elde etmek için daha küçük "öğrenci" modeline rehberlik ettiği yoğun bir damıtma iyileştirme süreci kullanır.

Ultralytics YOLOv5'e Giriş

Ultralytics YOLOv5, kararlılığı, kullanım kolaylığı ve geniş dağıtım ekosistemi ile ünlü, dünyanın en yaygın benimsenen görü mimarilerinden biridir.

YOLOv5 hakkında daha fazla bilgi edin

Ekosistem Standardı

YOLOv5, kullanılabilirlik açısından endüstri standardını yeniden tanımladı. PyTorch ile yerel olarak oluşturulmuş olup, güçlü özellik toplama için son derece optimize edilmiş bir CSPNet omurgası ve PANet boyun yapısı kullanır. Daha sonraki modellerde görülen çapasız (anchor-free) trendden önce gelmiş olsa da, otomatik çapa öğrenme ile birleşen oldukça rafine çapa tabanlı yaklaşımı, kullanıma hazır mükemmel bir performans sağlar.

YOLOv5'in gerçek gücü, İyi Korunan Ekosisteminde yatar. Comet ve Weights & Biases gibi izleme araçlarıyla sorunsuz bir şekilde entegre olur ve ONNX, TensorRT ve CoreML gibi formatlara tek tıkla dışa aktarmayı destekler.

YOLOv5 ile Başlarken

YOLOv5'i özel veri kümelerinde eğitmek inanılmaz derecede kolaydır. Modernleştirilmiş API, prototipten üretime geçişteki zorlukları azaltarak onu çevik mühendislik ekipleri arasında favori haline getirir.

Performans ve Metrik Karşılaştırması

Bu modelleri karşılaştırırken, ortalama Hassasiyet (mAP), çıkarım hızı ve parametre sayısı dengesine bakmak çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Ödünleşimleri Analiz Etme

DAMO-YOLO, damıtma eğitim aşamasından büyük ölçüde yararlanarak parametre boyutlarına göre etkileyici mAP skorları elde eder. Ancak bu, Eğitim Verimliliği pahasına gerçekleşir. Çok aşamalı damıtma süreci, önce ağır bir öğretmen modelinin eğitilmesini gerektirir, bu da gerekli GPU hesaplama süresini ve VRAM'i önemli ölçüde artırır.

Buna karşılık YOLOv5, mükemmel Bellek Gereksinimleri sunar. Ultralytics YOLO modelleri, karmaşık damıtma boru hatlarına veya RT-DETR gibi transformer tabanlı modellere kıyasla hem eğitim hem de çıkarım sırasında daha düşük bellek kullanımıyla bilinir. Bu, YOLOv5'in tüketici sınıfı donanımlarda veya Google Colab gibi erişilebilir bulut ortamlarında verimli bir şekilde eğitilmesini sağlar.

Gerçek Dünya Uygulamaları ve Çok Yönlülük

Doğru mimariyi seçmek genellikle dağıtım ortamına bağlıdır.

DAMO-YOLO'nun Öne Çıktığı Yerler

DAMO-YOLO kesinlikle bir nesne algılama modelidir. Akademik araştırma için, özellikle Sinir Mimarisi Araması çalışan ekipler veya makalede ayrıntıları verilen yeniden parametrelendirme tekniklerini çoğaltmayı hedefleyenler için mükemmel bir seçimdir. Eğer bir projenin damıtma eğitim aşamasını yürütmek için kapsamlı hesaplama kaynakları varsa ve yalnızca 2D sınırlayıcı kutular için doğruluk payının son kısmını sıkıştırmaya odaklanılıyorsa, DAMO-YOLO güçlü bir adaydır.

Ultralytics Avantajı

Gerçek dünya üretimi için, Ultralytics modellerinin Kullanım Kolaylığı ve Çok Yönlülüğü onları tercih edilen seçenek haline getirir. YOLOv5, algılama ve görüntü sınıflandırma için temel bir unsur olmaya devam ederken, daha geniş Ultralytics ekosistemi geliştiricilerin görevler arasında zahmetsizce geçiş yapmasına olanak tanır.

Örneğin, Ultralytics ailesindeki daha yeni yinelemeler; örnek bölümleme, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamayı yerel olarak destekler. Bu çok görevli yetenek, ekiplerin otomatik plaka tanıma işlemini araç bölümleme ile birleştirmek gibi karmaşık süreçler için tek bir birleşik Python API'si kullanabilmesini sağlar.

Kullanım Durumları ve Öneriler

DAMO-YOLO ile YOLOv5 arasında seçim yapmak; özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman DAMO-YOLO Seçilmeli

DAMO-YOLO şunlar için güçlü bir tercihtir:

  • Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.

Ne Zaman YOLOv5 Seçilmeli

YOLOv5 şunlar için önerilir:

  • Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun istikrar geçmişine, kapsamlı dokümantasyonuna ve devasa topluluk desteğine değer verilen mevcut dağıtımlar.
  • Kaynak Kısıtlı Eğitim: YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantajlı olduğu, sınırlı GPU kaynağına sahip ortamlar.
  • Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Gelecek: YOLO26'ya Geçiş

YOLOv5 efsanevi olsa da ve DAMO-YOLO ilginç akademik içgörüler sunsa da, teknolojinin son noktası gelişti. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, görü topluluğu için büyük bir ileri atılımı temsil ediyor.

YOLO26 hakkında daha fazla bilgi edin

YOLO26, uç dağıtımın ve eğitim kararsızlığının geleneksel darboğazlarını ele alıyor:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Maksimum Olmayan Bastırma (NMS) sonrası işlemeyi yerel olarak ortadan kaldırır. Bu atılım, dağıtım mantığını basitleştirir ve gecikme değişkenliğini önemli ölçüde azaltarak onu yüksek hızlı robotik ve otonom sistemler için ideal hale getirir.
  • MuSGD Optimize Edici: LLM eğitim yeniliklerinden (Moonshot AI'nın Kimi K2'si gibi) esinlenen YOLO26, MuSGD optimize edicisini (SGD ve Muon'un bir melezi) kullanır. Bu, son derece kararlı eğitim çalıştırmaları ve dikkat çekici derecede daha hızlı yakınsama sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağılım Odaklı Kaybı (DFL) stratejik olarak kaldırarak, YOLO26 CPU'larda ve uç cihazlarda YOLO11 ve YOLOv8 gibi seleflerine göre çok daha üstün hızlara ulaşır.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava drone görüntüleri ve IoT sensör beslemelerini analiz etmek için kritik olan küçük nesne tanımada kayda değer iyileştirmeler sağlar.

Kod Örneği: Eylemde Basitlik

Ultralytics paketi, modelleri sadece birkaç satır kodla eğitip dağıtmana olanak tanır. İster YOLOv5 kullanıyor ol, ister önerilen YOLO26'ya yükseltiyor ol, arayüz tutarlı ve sezgisel kalmaya devam eder.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Export the model for edge deployment
model.export(format="onnx")

Sonuç

Hem DAMO-YOLO hem de YOLOv5, bilgisayarlı görü dünyasına önemli ölçüde katkıda bulunmuştur. DAMO-YOLO, Sinir Mimarisi Araması ve damıtmanın gücünü sergileyerek araştırmacılar için ilginç bir çalışma konusu oluşturur. Ancak YOLOv5; Performans Dengesi, düşük bellek gereksinimleri ve benzersiz kullanım kolaylığı sayesinde pratik bir güç merkezi olmaya devam etmektedir.

Bugün yeni projelere başlayan geliştiriciler için tavsiye, Ultralytics Platform avantajlarından yararlanmaları ve YOLO26'yı benimsemeleridir. Bu model, YOLOv5'in sevilen kullanıcı dostu ekosistemini çığır açan mimari gelişmelerle birleştirerek, hem bulut hem de uç yapay zeka uygulamaları için üst düzey doğruluk ve ışık hızında çıkarım sağlar. Geliştiriciler ayrıca, özel eski donanım kısıtlamalarına bağlı olarak YOLOv6 veya YOLOX gibi diğer verimli modelleri keşfetmek isteyebilirler.

Yorumlar