Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO ile RTDETRv2 karşılaştırması#

Bilgisayarlı görü dünyasının hızla gelişen yapısı, hız, doğruluk ve hesaplama verimliliğini dengelemek için tasarlanmış etkileyici bir mimari yelpazesi ortaya çıkardı. Bu zorlukları çözmek için benzersiz yaklaşımlar sunan iki dikkat çekici model DAMO-YOLO ve RTDETRv2'dir. Her iki model de gerçek zamanlı çıkarım için en son teknoloji çözümler sunmayı amaçlasa da, mimari felsefeleri temelden farklılık gösterir.

Bu kapsamlı rehber, her iki modelin teknik özelliklerini, mimari yeniliklerini ve pratik kullanım senaryolarını derinlemesine incelerken, Ultralytics Platform ve en son teknoloji ürünü YOLO26 gibi modern çözümlerin konuşlandırma ve kullanım kolaylığı açısından endüstri standartlarını nasıl yeniden tanımladığını da keşfediyor.

Link to this sectionModel Genel Bakışları#

Link to this sectionDAMO-YOLO'yu Anlamak#

Alibaba Group'taki araştırmacılar tarafından geliştirilen DAMO-YOLO, büyük ölçüde Neural Architecture Search (NAS) yöntemine dayanan hızlı ve doğru bir nesne algılama yöntemi sunar. Geleneksel el yapımı omurga yapılarının yerini, düşük gecikme süresi için tasarlanmış NAS üretimi yapılarla değiştirir. Ayrıca, özellik birleştirme ve sınırlayıcı kutu tahminlerini kolaylaştırmak için verimli bir RepGFPN (Reparameterized Generalized Feature Pyramid Network) ve ZeroHead tasarımı içerir.

Ana Model Detayları:

DAMO-YOLO hakkında daha fazla bilgi edin

Link to this sectionRTDETRv2'yi Anlamak#

Baidu'nun RTDETRv2'si, Gerçek Zamanlı Algılama Transformer'ları için önemli bir atılımı temsil eder. Çapa kutularına ve Non-Maximum Suppression (NMS) işlemine dayanan geleneksel Evrişimli Sinir Ağlarının (CNN) aksine, RTDETRv2 tüm görüntü bağlamını bağlamsal olarak görmek için öz-dikkat mekanizmalarını kullanır. Doğrudan sınırlayıcı kutular çıktısı verir ve NMS son işleme adımını tamamen devre dışı bırakır. Bu model, çıkarım gecikmesini artırmadan temel doğruluğu iyileştirmek için bir "bag of freebies" eğitim stratejisi sunar.

Ana Model Detayları:

RTDETRv2 hakkında daha fazla bilgi edin

Görüntüleme Yapay Zekasında Transformer'ları Benimsemek

Transformer'lar daha yüksek hesaplama kaynakları gerektirse de, küresel bağlamı işleme yetenekleri, onları karmaşık sahne anlayışı için inanılmaz derecede etkili kılar; bu da RTDETRv2'nin en büyük gücüdür.

Link to this sectionPerformans Karşılaştırması#

Bu modelleri gerçek dünya uygulamaları için değerlendirirken, Ortalama Kesinlik (mAP), çıkarım hızı ve bellek kullanımı gibi parametreler kritiktir. RTDETRv2 gibi Transformer tabanlı modeller, DAMO-YOLO gibi hafif CNN'lere kıyasla eğitim ve çıkarım sırasında genellikle daha yüksek CUDA bellek ihtiyacı duyar.

Aşağıda performans metriklerinin ayrıntılı bir karşılaştırması yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

Link to this sectionİdeal Kullanım Senaryoları#

DAMO-YOLO Nerede Öne Çıkıyor: NAS ile optimize edilmiş omurgası ve daha küçük varyantlarındaki (DAMO-YOLOt gibi) olağanüstü düşük parametre sayısı sayesinde, oldukça kısıtlı donanımlar üzerinde konuşlandırma için son derece uygundur. ONNX gibi çalışma zamanlarını veya uç bilişim için özel TensorRT motorlarını kullanarak gömülü cihazlar için çözümler oluşturuyorsan, DAMO-YOLO son derece duyarlı bir çerçeve sunar.

RTDETRv2 Nerede Öne Çıkıyor: RTDETRv2, sunucu sınıfı GPU'ların mevcut olduğu ve küresel görüntü bağlamının her şeyden önemli olduğu senaryolarda parlar. Transformer mimarisi, NMS olmadan çakışan sınırlayıcı kutuları doğal bir şekilde çözmesine olanak tanır, bu da onu yoğun kalabalık yönetimi veya uzak nesneler arasındaki mekansal ilişkilerin kritik olduğu karmaşık nesne takibi için sağlam bir seçenek haline getirir.

Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#

DAMO-YOLO ve RTDETRv2 önemli akademik başarıları temsil etse de, bu modelleri ölçeklenebilir, üretime hazır uygulamalara dönüştürmek zor olabilir. Geliştiriciler genellikle parçalı kod tabanları, çok görevli öğrenme desteği eksikliği ve karmaşık konuşlandırma boru hatlarıyla karşı karşıya kalırlar.

İşte Ultralytics ekosistemi tam bu noktada kendini ayırır. Kullanım kolaylığına, bakımı iyi yapılmış bir Python API'sine ve benzersiz çok yönlülüğe öncelik vererek, Ultralytics geliştiricilerin hata ayıklamaya daha az, inşa etmeye daha fazla zaman ayırmasını sağlar.

Yakın zamanda piyasaya sürülen Ultralytics YOLO26 modeli, bu avantajları bir üst seviyeye taşıyarak hem DAMO-YOLO hem de RTDETRv2'yi geride bırakan atılımlar sunuyor:

  • Uçtan Uca NMS-Free Tasarım: İlk olarak YOLOv10 içinde öncülük edilen YOLO26, yerel olarak uçtan uca çalışır. Bu, NMS son işlemini tamamen ortadan kaldırarak konuşlandırmayı geleneksel CNN'lerden daha hızlı ve çok daha basit hale getirirken, RTDETRv2'nin doğrudan çıktı avantajlarını da yakalar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Ayrık GPU'ları olmayan uç yapay zeka cihazları için ağır bir şekilde optimize edilmiştir, bu da onu bellek yoğunluklu transformer'lara kıyasla IoT uygulamaları için çok daha üstün bir seçenek haline getirir.
  • MuSGD Optimizer: Moonshot AI'nın Kimi K2'sinden ilham alan bu SGD ve Muon hibriti, Büyük Dil Modeli (LLM) eğitim yeniliklerini bilgisayarlı görü dünyasına getirerek dikkat çekici derecede kararlı bir eğitim ve daha hızlı yakınsama sağlar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, modellerin geleneksel olarak zorlandığı küçük nesne tanıma konusunda kayda değer iyileştirmeler sunar. Bu, hava görüntüleri ve drone uygulamaları için kritiktir.
  • DFL Kaldırma: Basitleştirilmiş dışa aktarma formatları ve düşük güç tüketen uç cihazlarla daha iyi uyumluluk sağlamak için Distribution Focal Loss kaldırılmıştır.
  • Eşsiz Çok Yönlülük: Sadece algılama ile sınırlı olan rakip modellerin aksine YOLO26, Yönlendirilmiş Sınırlayıcı Kutular (OBB) için özel açı kaybı, piksel hassasiyetinde doğruluk için anlamsal segmentasyon kaybı ve Poz tahmini için Residual Log-Likelihood Estimation (RLE) gibi göreve özel iyileştirmeler içerir.

YOLO26 hakkında daha fazla bilgi edin

Bellek Verimliliği Önemlidir

RTDETRv2 gibi transformer tabanlı modellerin eğitimi, genellikle maliyetli çoklu GPU kurulumları gerektiren muazzam CUDA bellek tahsisleri gerektirir. Ultralytics YOLO modelleri, hem eğitim hem de çıkarım sırasında dikkat çekici derecede düşük bellek gereksinimlerini koruyarak, yapay zeka geliştirmeyi araştırmacılar ve hobi sahipleri için demokratikleştirir.

Link to this sectionKod Örneği: Birleşik Ultralytics API'si#

Ultralytics ekosisteminin en büyük faydalarından biri birleşik API'sidir. RTDETR'nin PyTorch uygulaması ve en son teknoloji YOLO modelleri dahil olmak üzere çeşitli modelleri, iş akışını değiştirmeden sorunsuz bir şekilde yükleyebilir, eğitebilir ve doğrulayabilirsin.

from ultralytics import RTDETR, YOLO

# Load an RTDETRv2 model
model_rtdetr = RTDETR("rtdetr-l.pt")

# Load the cutting-edge YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Run inference on an image with a simple, unified interface
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")
results_yolo = model_yolo("https://ultralytics.com/images/bus.jpg")

# Display the detected objects
results_yolo[0].show()

Bu basitlik, özel veri kümesi eğitimi ve dışa aktarma için de geçerlidir. Ultralytics Python paketi kullanarak, geliştiriciler eğitilmiş ağırlıklarını CoreML veya OpenVINO gibi konuşlandırma platformlarına tek bir komutla kolayca gönderebilirler.

Link to this sectionSonuç ve Daha Fazla Keşif#

Hem DAMO-YOLO hem de RTDETRv2, gerçek zamanlı nesne algılamada nelerin mümkün olduğunun sınırlarını inkar edilemez bir şekilde zorladı. DAMO-YOLO, ham verimlilik için yüksek düzeyde optimize edilmiş, otomatik aranan ağ yapıları sağlarken, RTDETRv2 NMS gibi geleneksel darboğazları ortadan kaldırarak transformer'ların gerçek zamanlı alanda rekabet edebileceğini kanıtladı.

Ancak performans, kapsamlı dokümantasyon ve üretime hazır olma konusunda en üst düzey dengeyi arayan geliştiriciler için Ultralytics YOLO modelleri altın standart olmaya devam ediyor. YOLO26'nın piyasaya sürülmesiyle kullanıcılar, transformer benzeri uçtan uca algılama, LLM'den ilham alan eğitim verimliliği ve rakipsiz CPU hızlarına, sezgisel ve sağlam bir ekosistem içinde erişim sağlıyor.

Bir sonraki projen için modelleri değerlendiriyorsan, EfficientDet vs RTDETR karşılaştırmalarımızı okumayı, önceki nesil YOLO11 modelini keşfetmeyi veya YOLOX gibi akademik temelleri incelemeyi değerli bulabilirsin. Ultralytics hızlı başlangıç kılavuzunu keşfederek hemen geliştirmeye başla.

Yorumlar