Link to this sectionDAMO-YOLO ile YOLOv7 karşılaştırması#
Bilgisayarlı görüdeki hızlı gelişim, hassasiyet ve hesaplama maliyetini dengelemek için tasarlanmış oldukça verimli nesne algılama modelleri ortaya çıkardı. 2022'de tanıtılan iki dikkat çekici model DAMO-YOLO ve YOLOv7'dir. Her ikisi de gerçek zamanlı görü görevlerinin sınırlarını zorlamayı amaçlasa da, sonuçlarına çok farklı mimari paradigmalar ve eğitim metodolojileri aracılığıyla ulaşırlar.
Bu kapsamlı teknik karşılaştırma, her iki modelin farklı yaklaşımlarını keşfeder; makine öğrenimi mühendislerinin kendi bilgisayarlı görü uygulamaları için doğru aracı seçmelerine yardımcı olmak amacıyla mimarilerini, dağıtım potansiyellerini ve performans metriklerini inceler.
Link to this sectionModel Kökenleri ve Meta Verileri#
Derin teknik analize dalmadan önce, bu iki bilgisayarlı görü modelinin kökenlerini bağlama oturtmak önemlidir.
Link to this sectionDAMO-YOLO#
Alibaba Group'taki araştırmacılar tarafından geliştirilen DAMO-YOLO, otomatik mimari arama ve damıtma yoluyla hem hızı hem de doğruluğu optimize etmek için tanıtıldı.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 23 Kasım 2022
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
DAMO-YOLO hakkında daha fazla bilgi edin
Link to this sectionYOLOv7#
2022 ortalarında en güncel teknoloji (SOTA) olarak piyasaya sürülen YOLOv7, dağıtım maliyetlerini artırmadan eğitilebilir "bag-of-freebies" yöntemlerini sunarak gerçek zamanlı çıkarımı daha ileriye taşıdı.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
- Tarih: 6 Temmuz 2022
- Arxiv: 2207.02696
- Dokümantasyon: YOLOv7 Dokümantasyonu
YOLOv7 hakkında daha fazla bilgi edinin
YOLOv7, Ultralytics ekosistemi içinde resmi olarak desteklenmekte olup birleşik bir API ile sorunsuz eğitim, doğrulama ve dışa aktarmaya olanak tanır.
Link to this sectionMimari Yenilikler#
Link to this sectionDAMO-YOLO: NAS ve Damıtma#
DAMO-YOLO, maksimum verimliliğe yönelik çeşitli ileri teknoloji teknikleri içerir:
- NAS Omurgaları: Gecikmeye duyarlı ortamlar için özel olarak tasarlanmış optimal omurgaları (MAE-NAS) otomatik olarak tasarlamak için Sinir Mimarisi Arama (NAS) kullanır.
- Verimli RepGFPN: Birden fazla ölçekte özellik birleştirme verimliliğini önemli ölçüde artıran değiştirilmiş bir Genelleştirilmiş Özellik Piramidi Ağı.
- ZeroHead & AlignedOTA: Hesaplama yükünü azaltmak için hafif bir algılama başlığı ve optimize edilmiş bir etiket atama stratejisi (AlignedOTA) içerir.
- Damıtma Geliştirmesi: Küçük model varyantlarının performansını, parametre sayılarını artırmadan yükseltmek için eğitim sırasında yoğun bir şekilde bilgi damıtmadan yararlanır.
Link to this sectionYOLOv7: E-ELAN ve Bag-of-Freebies#
YOLOv7, gradyan yolu optimizasyonuna ve sağlam eğitim stratejilerine odaklanarak daha yapısal bir mühendislik yaklaşımı benimsemiştir.
- E-ELAN Mimarisi: Genişletilmiş Verimli Katman Birleştirme Ağı, modelin en kısa ve en uzun gradyan yollarını kontrol ederek daha çeşitli özellikleri öğrenmesini sağlar ve etkili öğrenme yakınsaması garantiler.
- Model Ölçeklendirme: Birleştirme tabanlı modeller için özel olarak hazırlanmış, yapısal uyum için derinliği ve genişliği aynı anda ölçeklendiren bir bileşik ölçeklendirme yöntemi sunar.
- Eğitilebilir Bag-of-Freebies: Kimlik bağlantıları olmayan yeniden parametrelendirilmiş evrişimler (RepConv) gibi teknikleri ve çıkarım hızını etkilemeden eğitim sırasında doğruluğu artıran dinamik etiket atama stratejilerini kullanır.
Link to this sectionPerformans Analizi#
ortalama Hassasiyet (mAP), hız ve verimlilik değerlendirilirken, her iki model de etkileyici metrikler sergiler ancak biraz farklı segmentleri hedeflerler. YOLOv7 yüksek doğruluklu GPU dağıtımına odaklanırken, DAMO-YOLO'nun NAS kaynaklı yapıları agresif, düşük gecikmeli CPU ve uç (edge) cihaz dağıtımını hedefler.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Metriklerde görüldüğü üzere, DAMO-YOLO son derece hafif varyantlar (sadece 8,5M parametreli tiny modeli gibi) sunarken, YOLOv7 daha yüksek genel doğruluk zirvesine ulaşır ve YOLOv7x, COCO veri setinde etkileyici bir 53,1 mAP değerine ulaşır.
Link to this sectionUltralytics Ekosistemi Avantajı#
Teorik mimari önemli olsa da, bir modelin pratikliği ekosistemi tarafından belirlenir. YOLOv7 gibi Ultralytics tarafından desteklenen modeller, iyi bakılan bir ekosistemden ve benzersiz bir kullanım kolaylığından yararlanır.
- Performans Dengesi: Ultralytics modelleri, çıkarım hızı ile algılama doğruluğu arasında sürekli olarak optimal bir denge kurarak hem uç cihazlar hem de bulut tabanlı model dağıtımı için ideal hale gelir.
- Bellek Gereksinimleri: Daha ağır Transformer tabanlı modellerin aksine, Ultralytics YOLO modelleri eğitim sırasında düşük CUDA bellek gereksinimlerini korur. Bu, tüketici sınıfı donanımlarda bile eğitim sürecini kolaylaştırarak daha büyük toplu boyutlara izin verir.
- Çok Yönlülük: Ultralytics çerçevesi, nesne algılamanın ötesine geçerek Örnek Segmentasyonu ve Poz Tahmini gibi görevleri kapsar ve geliştiricilere eksiksiz bir bilgisayarlı görü araç seti sunar.
Ultralytics paketi, yüksek oranda optimize edilmiş veri yükleyicilerden ve önceden eğitilmiş ağırlıklardan yararlanarak veri setlerinden tamamen eğitilmiş bir modele dakikalar içinde sorunsuz bir şekilde geçmenizi sağlar.
Link to this sectionKod Örneği: Ultralytics ile YOLOv7 Eğitimi#
YOLOv7'yi bilgisayarlı görü iş akışına entegre etmek, Ultralytics Python API kullanarak inanılmaz derecede basittir.
from ultralytics import YOLO
# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference and validate results
metrics = model.val()
predictions = model.predict("https://ultralytics.com/images/bus.jpg", save=True)Link to this sectionYeni Standart: YOLO26 ile Tanışın#
YOLOv7 ve DAMO-YOLO 2022'de önemli atılımları temsil etse de, görü yapay zekası alanı hızla ilerlemektedir. Bugün yeni projeler başlatan ekipler için önerilen model, Ocak 2026'da piyasaya sürülen en güncel Ultralytics YOLO26'dır.
YOLO26, en son yenilikleri bünyesinde barındırarak performans ve kullanılabilirlikte nesilsel bir sıçrama sağlar:
- Uçtan Uca NMS-Free Tasarım: YOLO26 doğal olarak uçtan ucadır. Non-Maximum Suppression (NMS) son işleme adımını ortadan kaldırarak, başlangıçta YOLOv10 tarafından öncülük edilen bir paradigma değişimi olan daha hızlı ve daha basit dağıtım mantığı sunar.
- MuSGD Optimize Edici: Moonshot AI'ın Kimi K2'si gibi büyük dil modeli yeniliklerinden esinlenen YOLO26, SGD ve Muon'un bir hibritini kullanır. Bu optimize edici, son derece istikrarlı eğitim dinamikleri ve dramatik derecede daha hızlı yakınsama oranları sağlar.
- %43'e Varan Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL)'nin hedeflenen kaldırılması ve köklü yapısal iyileştirmelerle YOLO26, düşük güçlü uç bilişim için yoğun bir şekilde optimize edilmiş olup GPU olmayan donanımlarda önceki nesillerden daha iyi performans gösterir.
- ProgLoss + STAL: Hava görüntüleri, robotik ve güvenlik izleme gibi uygulamalar için gerekli bir yetenek olan küçük nesne tanımayı açıkça hedefleyen ve geliştiren gelişmiş yeni kayıp işlevlerini içerir.
- Göreve Özel İyileştirmeler: Standart algılamanın ötesinde YOLO26, segmentasyon için çok ölçekli prototipleme, poz tahmini için RLE ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) için özel açı kayıpları dahil olmak üzere çeşitli görevler için özel iyileştirmelere sahiptir.
YOLO26 hakkında daha fazla bilgi edin
Link to this sectionİdeal Kullanım Senaryoları#
Doğru mimariyi seçmek tamamen hedef dağıtım ortamına ve proje kısıtlamalarına bağlıdır.
DAMO-YOLO ne zaman seçilmeli:
- Ham parametre sayısının son derece düşük tutulması gereken (örneğin mikrodenetleyiciler) ağır kısıtlı ve kaynakları sınırlı uç ortamlarda çalışıyorsan.
- Özellikle Alibaba'nın özel bulut hizmetleriyle entegre edilmiş otomatik makine öğrenimi iş akışlarını kullanıyorsan.
YOLOv7 ne zaman seçilmeli:
- Çapa tabanlı, yüksek doğruluklu çıkarım için halihazırda optimize edilmiş eski GPU iş akışlarına sahipsen.
- Yüksek hızlı otonom araçlar veya gelişmiş robotik gibi gerçek zamanlı doğruluğun en önemli olduğu ortamlarda çalışıyorsan.
YOLO26 ne zaman seçilmeli (Önerilen):
- Sıfırdan yeni bir bilgisayarlı görü uygulaması geliştiriyorsan ve hem hassasiyet hem de CPU/uç çıkarım hızında mutlak en güncel teknolojiye ihtiyacın varsa.
- NMS operatör kısıtlamalarıyla uğraşmadan hızlı ve sorunsuz dağıtım (örneğin CoreML veya TensorRT'ye aktarma) gerekiyorsa.
- Bulut eğitimi, veri seti yönetimi ve otomatik dağıtım için Ultralytics Platform yeteneklerinin tamamını kullanmak istiyorsan.
Ultralytics modellerinin sağlam ekosisteminden yararlanarak mühendislik süresini önemli ölçüde azaltabilir ve gerçek dünya uygulamaların için üst düzey tahmin performansı sağlayabilirsin.