Link to this sectionDAMO-YOLO ve YOLOv10#
Bilgisayarlı görü alanı, gerçek zamanlı nesne algılama mimarilerinde hızlı bir evrime tanık oldu. DAMO-YOLO ve YOLOv10'u karşılaştırdığımızda, model tasarımında iki farklı felsefe görüyoruz: otomatik mimari arayışı ile uçtan uca NMS içermeyen optimizasyon. Her ikisi de doğruluk ve hızın sınırlarını zorlasa da, temel yapıları ve ideal kullanım durumları önemli ölçüde farklılık gösterir.
Link to this sectionDAMO-YOLO: Ölçekte Sinirsel Mimari Arama#
Alibaba Group tarafından geliştirilen DAMO-YOLO, yapısal verimlilik için otomatik keşiften yararlanmaya odaklanan güçlü bir dedektör olarak ortaya çıktı.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Tarih: 23 Kasım 2022
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
Link to this sectionMimari Öne Çıkanlar#
DAMO-YOLO, performans ve gecikmeyi dengelemek için büyük ölçüde Sinirsel Mimari Arayışı'na (NAS) güvenir. MAE-NAS olarak adlandırılan ana yapısı, optimal katman derinliğini ve genişliğini bulmak için katı hesaplama bütçeleri altında çok amaçlı evrimsel arayış kullanır.
Ölçekler arası özellik birleştirme işlemini gerçekleştirmek için model, verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) kullanır. Bu ağır boyun tasarımı, özellikle karmaşık uzamsal hiyerarşileri çıkarmada yeteneklidir ve bu da onu hava görüntüleri analizi gibi senaryolarda kullanışlı kılar. Ek olarak DAMO-YOLO, eğitim sırasında sağlam bir damıtma iyileştirme sürecine güvenerek nihai tahmin katmanlarının karmaşıklığını önemli ölçüde azaltan aerodinamik bir algılama kafası olan ZeroHead'i sunar.
DAMO-YOLO genellikle çok aşamalı bir bilgi damıtma süreci kullanır. Daha küçük "öğrenci" modeline rehberlik etmesi için daha ağır bir "öğretmen" modelinin eğitilmesini gerektirir; bu da daha yüksek mAP (ortalama Ortalama Hassasiyet) elde edilmesini sağlar ancak gereken GPU hesaplama süresini önemli ölçüde artırır.
DAMO-YOLO hakkında daha fazla bilgi edinin
Link to this sectionYOLOv10: Uçtan Uca Nesne Algılamada Öncü#
Bir buçuk yıl sonra piyasaya sürülen YOLOv10, çıkarım sırasında Nesne Olmayanları Bastırma (NMS) ihtiyacını tamamen ortadan kaldırarak bir paradigma değişimi başlattı.
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu ve diğerleri.
- Organizasyon: Tsinghua Üniversitesi
- Tarih: 23 Mayıs 2024
- Arxiv: 2405.14458
- Dokümanlar: Ultralytics YOLOv10
Link to this sectionMimari Öne Çıkanlar#
YOLOv10'un öne çıkan özelliği, NMS içermeyen eğitim için tutarlı ikili atamalarıdır. Geleneksel dedektörler, tek bir nesne için birden fazla çakışan sınırlayıcı kutu tahmin eder ve kopyaları filtrelemek için NMS gerektirir. Bu işlem sonrası adım, özellikle uç cihazlarda bir darboğaz oluşturur. YOLOv10, modelin nesne başına doğal olarak tek bir doğru sınırlayıcı kutu tahmin etmesine izin vererek bunu çözer.
Yazarlar ayrıca bütünsel bir verimlilik-doğruluk odaklı model tasarımına odaklandılar. Mevcut mimarilerdeki hesaplama fazlalığını dikkatlice analiz ederek, FLOP sayısını ve parametreleri azaltmak için ana yapıyı ve kafayı optimize ettiler. Bu hafif tasarım, YOLOv10'un TensorRT veya OpenVINO gibi formatlara aktarıldığında olağanüstü çıkarım gecikmesi sunmasını sağlar.
YOLOv10 hakkında daha fazla bilgi edin
Link to this sectionPerformans ve Kıyaslamalar#
Aşağıdaki tablo, COCO veri setindeki ham performans metriklerini göstermektedir. Her sütundaki en iyi genel değerler kalın olarak vurgulanmıştır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
DAMO-YOLO doğruluk açısından kendi yerini korurken, YOLOv10 sürekli olarak daha düşük gecikme süresi ve önemli ölçüde daha küçük model ağırlıkları sağlar. Örneğin YOLOv10s, parametrelerin yarısından azını (7.2M'ye karşı 16.3M) kullanırken DAMO-YOLO'lardan (46.0%) biraz daha yüksek bir mAP (46.7%) elde eder. Daha düşük bellek gereksinimleri, YOLOv10'u gömülü sistemler için son derece çok yönlü bir seçenek haline getirir.
Link to this sectionEğitim Verimliliği ve Kullanılabilirlik#
Akademik araştırmadan üretime geçerken, kullanım kolaylığı çok önemlidir. DAMO-YOLO'nun çok aşamalı damıtma süreci ve karmaşık NAS konfigürasyonları, mühendislik ekipleri için zorlu öğrenme eğrileri oluşturabilir.
Conversely, YOLOv10 benefits immensely from being fully integrated into the Ultralytics Python SDK. Training a custom model involves minimal boilerplate code. Ultralytics handles data augmentation, hyperparameter tuning, and experiment tracking automatically.
from ultralytics import YOLO
# Load a pretrained YOLOv10 nano model
model = YOLO("yolov10n.pt")
# Train on a custom dataset with built-in validation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image seamlessly
prediction = model("path/to/image.jpg")
prediction[0].show()Ultralytics ekosistemini kullanmak, geliştiricilerin eski çerçevelerin gerektirdiği karmaşık ortam kurulumlarını atlayarak bir prototipten tamamen dışa aktarılmış bir ONNX modeline sadece birkaç satır kodla geçmelerini sağlar.
Link to this sectionGerçek Dünya Kullanım Durumları#
- Akıllı Perakende (DAMO-YOLO): DAMO-YOLO'nun doğruluğu, GPU'ların bol olduğu ve gerçek zamanlı NMS darboğazlarının yönetilebilir olduğu müşteri davranışlarını analiz eden yüksek yoğunluklu sunucu ortamları için çok uygundur.
- Otonom Araçlar (YOLOv10): NMS içermeyen mimari, otonom sürüş sistemlerindeki güvenlik için kritik olan belirleyici ve tahmin edilebilir gecikmeyi garanti eder.
- Industrial Automation (YOLOv10): Detecting defects on fast-moving assembly lines requires models that maximize real-time inference speeds without consuming vast VRAM, making YOLOv10 a prime candidate for edge deployment.
Link to this sectionKullanım Durumları ve Öneriler#
DAMO-YOLO ile YOLOv10 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionNe Zaman DAMO-YOLO Seçilmeli#
DAMO-YOLO şunlar için güçlü bir seçimdir:
- Yüksek Verimli Video Analitiği: Toplu-1 (batch-1) veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite kontrol gibi, özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Neural Architecture Search Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametreleştirilmiş omurgaların algılama performansı üzerindeki etkilerini inceleme.
Link to this sectionNe Zaman YOLOv10 Seçilmeli#
YOLOv10 şunlar için önerilir:
- NMS'siz Gerçek Zamanlı Tespit: Non-Maximum Suppression (NMS) olmadan uçtan uca tespitten yararlanan ve dağıtım karmaşıklığını azaltan uygulamalar.
- Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile tespit doğruluğu arasında güçlü bir denge gerektiren projeler.
- Tutarlı Gecikme Süreli Uygulamalar: robotik veya otonom sistemler gibi öngörülebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionGelecek Nesil: Ultralytics YOLO26 ile Tanışın#
YOLOv10, NMS içermeyen algılama için temelleri atmış olsa da teknoloji hızla gelişti. Modern uygulamalar için Ultralytics YOLO26 modeli, önceki nesillerin en iyilerini alıp üretime uygun şekilde geliştirerek benzersiz performans ve kullanılabilirlik sunar.
YOLO26 features a strictly natively end-to-end design, eliminating NMS post-processing for simpler deployment pipelines across edge devices. Furthermore, the removal of Distribution Focal Loss (DFL) has dramatically improved compatibility with low-power edge AI hardware.
Eğitim tarafında YOLO26, Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenen bir hibrit olan MuSGD Optimizer'ı tanıtır. Bu, daha kararlı bir eğitim ve daha hızlı yakınsama sağlar. ProgLoss + STAL kayıp fonksiyonlarıyla birleştirildiğinde YOLO26, yaban hayatı koruma ve drone operasyonları için kritik bir özellik olan küçük nesne tanımada dikkate değer iyileştirmeler sergiler.
En önemlisi YOLO26 sadece bir nesne dedektörü değildir. Örnek Bölütleme, Residual Log-Likelihood Estimation (RLE) kullanarak Poz Tahmini ve Yönelimli Sınırlayıcı Kutular (OBB) için özel açı kayıplarını yerel olarak destekleyerek her alanda göreve özel iyileştirmeler sunar. Öncüllerinden %43'e kadar daha hızlı CPU çıkarımı ile çevik mühendislik ekipleri için kesin tercihtir.
YOLO26 modellerinin merkezi yönetimi, etiketlenmesi ve bulut eğitimi için Ultralytics Platformu, tüm bilgisayarlı görü yaşam döngüsünü kolaylaştıran sezgisel bir arayüz sağlar.
Diğer yeni gelişmeleri keşfetmek isteyen geliştiriciler, farklı mimari çözümler gerektiren senaryolar için Ultralytics YOLO11 veya transformer tabanlı RT-DETR çerçevesini de değerlendirebilirler.