YOLOv7 ve DAMO-YOLO: Kapsamlı Bir Teknik Karşılaştırma

Gerçek zamanlı nesne algılama dünyası sürekli gelişiyor; araştırmacılar ve mühendisler hız ile doğruluk arasında en uygun dengeyi bulmak için çabalıyor. Bu teknik karşılaştırmada, 2022'den iki önemli mimariyi, YOLOv7 ve DAMO-YOLO modellerini derinlemesine inceleyeceğiz. Her iki model de bilgisayarlı görü topluluğuna yeni kavramlar getirerek model eğitimi, mimari tasarım ve dağıtım süreçlerinde farklı zorlukları ele aldı.

Model Geçmişleri ve Teknik Detaylar

Mimarilerine girmeden önce, bu iki modelin kökenlerini anlamak çok önemlidir. Her ikisi de önde gelen araştırma grupları tarafından geliştirilmiş ve gerçek zamanlı nesne algılamanın sınırlarını zorlamak için gelişmiş metodolojiler sunmuştur.

YOLOv7 Detayları

YOLO ailesinin bir devamı olarak geliştirilen YOLOv7, çıkarım maliyetini artırmadan doğruluğu önemli ölçüde artırmak için eğitilebilir "bag-of-freebies" kavramını tanıttı.

YOLOv7 hakkında daha fazla bilgi edinin

DAMO-YOLO Detayları

Alibaba Group araştırmacıları tarafından oluşturulan DAMO-YOLO, çeşitli donanımlar için oldukça verimli modeller oluşturmak amacıyla Sinir Mimarisi Arama (NAS) ve gelişmiş bilgi damıtma tekniklerine yoğunlaştı.

DAMO-YOLO hakkında daha fazla bilgi edinin

Mimari Yenilikler

YOLOv7: Gradyan Yol Analizi ve Yeniden Parametrelendirme

YOLOv7, büyük ölçüde Genişletilmiş Verimli Katman Birleştirme Ağlarına (E-ELAN) odaklanır. Yazarlar, E-ELAN'ı ağın gradyan yollarını analiz ederek tasarladılar ve ağın orijinal gradyan yolunu bozmadan sürekli öğrenmesini sağladılar. Ayrıca YOLOv7, çıkarım sırasında model yeniden parametrelendirmesinden etkili bir şekilde yararlanır ve FLOPs değerini azaltıp yürütme sürelerini hızlandırmak için katmanları sorunsuz bir şekilde birleştirir. Bu özellik, modern GPU'larda gerçek zamanlı çıkarım için onu oldukça yetenekli kılar.

DAMO-YOLO: Sinir Mimarisi Arama ve RepGFPN

DAMO-YOLO, gecikme kısıtlamaları altında Sinir Mimarisi Arama (NAS) yönteminden yoğun şekilde yararlanarak farklı bir yol izler. Mobil cihazlar veya belirli uç donanım hızlandırıcıları gibi özel donanımlar için optimize edilmiş omurga modellerini keşfetmek üzere MAE-NAS adlı bir çerçeve kullanır. Boyun yapısı için verimli bir RepGFPN (Yeniden parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) sunar ve tahmin başlıklarındaki hesaplama yükünü en aza indirmek için ZeroHead tasarımını kullanır.

Damıtma Farklılıkları

YOLOv7 güçlü içsel mimari optimizasyonlarına dayanırken, DAMO-YOLO karmaşık bir çok aşamalı bilgi damıtma sürecine büyük ölçüde güvenir. Eğitim aşamasında hesaplama açısından maliyetli olabilen, küçük bir öğrenci modeline bilgi aktarmak için büyük bir öğretmen modelinin eğitilmesini gerektirir.

Performans ve Metrik Karşılaştırması

Bu modelleri karşılaştırırken mAP (Mean Average Precision), çıkarım hızı ve model karmaşıklığına bakmak çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Yukarıdaki tablo, YOLOv7'nin yüksek doğruluk gerektiren alanlarda (YOLOv7x) iyi ölçeklendiğini, DAMO-YOLO'nun ise kısıtlı ortamlar için son derece optimize edilmiş küçük modeller sunduğunu göstermektedir.

Eğitim Verimliliği ve Bellek Gereksinimleri

İki mimari arasındaki temel fark, eğitim metodolojilerinde yatmaktadır. DAMO-YOLO'nun damıtmaya olan bağımlılığı, yeni bir modeli sıfırdan eğitmenin veya özel bir bilgisayarlı görü veri seti üzerinde ince ayar yapmanın genellikle çok daha fazla VRAM ve GPU hesaplama süresi gerektirdiği anlamına gelir.

Buna karşılık, YOLOv7 ve sonraki sürümleri gibi Ultralytics ekosistemine entegre edilen modeller, bellek gereksinimleri açısından yoğun bir şekilde optimize edilmiştir. Geliştiricilerin tüketici donanımlarında bellek hatası almadan daha büyük yığın boyutları kullanmalarına olanak tanır ve böylece deney takibi ve yineleme sürecini basitleştirir.

Ultralytics Avantajı

Hem YOLOv7 hem de DAMO-YOLO ilgi çekici özellikler sunsa da, modelleri Ultralytics ekosistemi içinde dağıtmak benzersiz bir geliştirici deneyimi sağlar.

  • Kullanım Kolaylığı: Ultralytics Python paketi, birleşik ve basit bir API sunar. Model mimarileri arasında hızlıca geçiş yapabilir, eğitim döngülerini başlatabilir veya birkaç satır kodla çıkarım çalıştırabilirsin.
  • İyi Korunan Ekosistem: Ultralytics, en son PyTorch sürümleri ve CUDA sürücüleri ile doğal uyumluluğu sağlayarak sık güncellemeler sunar. Ayrıca modelleri ONNX, TensorRT ve OpenVINO gibi formatlara dışa aktarmayı basitleştirir.
  • Çok Yönlülük: Sadece bir nesne algılayıcı olan DAMO-YOLO'nun aksine, Ultralytics ekosistemi çeşitli görevleri doğal olarak destekler. Ultralytics ailesindeki modeller standart sınırlayıcı kutu algılama, poz tahmini, örnek segmentasyonu ve Yönelimli Sınırlayıcı Kutular (OBB) işlemlerini gerçekleştirebilir.

Kod Örneği: Hızlıca Başlangıç

Ultralytics modellerini kullanarak yükleme, eğitim ve çıkarım işlemlerini ne kadar kolay yapabileceğin aşağıdadır:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")
Modelleri Dışa Aktarma

Ultralytics ile eğitilmiş ağırlıklarını (TensorRT veya CoreML gibi) çeşitli donanım hızlandırmalı formatlara dışa aktarmak, dışa aktarma komutundaki tek bir argümanla gerçekleştirilir ve saatler süren karmaşık komut dosyası yapılandırmalarından tasarruf sağlar.

Gelecek Nesil: YOLO26

YOLOv7 güçlü bir eski mimari olmaya devam etse de, alan hızla ilerledi. Yeni dağıtımlar için, önceki nesillerin neredeyse tüm metriklerde önüne geçen (Ocak 2026'da yayınlanan) Ultralytics YOLO26 önerilen standarttır.

  • Uçtan Uca NMS-İçermeyen Tasarım: İlk olarak YOLOv10 ile öncülük edilen YOLO26, NMS (Maksimum Olmayan Baskılama) sonrası işlemine olan ihtiyacı tamamen ortadan kaldırır. Bu, robotik ve sürücüsüz araç teknolojileri için kritik olan deterministik, ultra düşük gecikmeli çıkarımı garanti eder.
  • MuSGD Optimize Edici: Gelişmiş LLM eğitim tekniklerinden (Moonshot AI'nın Kimi K2'si gibi) esinlenen bu hibrit optimize edici, oldukça kararlı eğitim ve veri setleri genelinde daha hızlı yakınsama sağlamak için SGD ve Muon'u harmanlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağılımsal Odak Kaybını (DFL) stratejik olarak kaldırarak, YOLO26 uç bilişim platformlarında ve CPU'larda performansı önemli ölçüde artırır.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesnelerin algılanmasında büyük iyileştirmeler sağlar ve YOLO26'yı hava görüntüleri ve detaylı gözetim projeleri için son derece uygun hale getirir.

YOLO26 hakkında daha fazla bilgi edin

İdeal Kullanım Durumları

Ne Zaman DAMO-YOLO Seçilmeli

  • NAS Üzerine Akademik Araştırmalar: Eğer kurumun Sinir Mimarisi Arama metodolojilerini incelemeye yoğun bir şekilde yatırım yapıyorsa.
  • Belirli Donanımlarda Hiper-Kısıtlı Gecikme: Özel bir yapay zeka hızlandırıcı çip için özel bir omurga bulmak amacıyla kapsamlı NAS aramaları yapacak kaynaklara sahipsen.

Ne Zaman YOLOv7 Seçilmeli

  • Mevcut GPU İş Hatları: YOLOv7'nin özel E-ELAN mimarisi etrafında üst düzey NVIDIA donanımlarında optimize edilmiş eski üretim iş hatlarını sürdüren ekipler için.

Neden Modern Ultralytics Modellerine (YOLO11 / YOLO26) Geçmelisin?

Perakende analitiği, akıllı üretim ve sağlık hizmetlerine kadar kurumsal uygulamaların büyük çoğunluğu için modern Ultralytics modelleri rakipsizdir. Ultralytics Platformu ile entegrasyon, kullanım kolaylığı, üstün dokümantasyon, güçlü topluluk desteği ve çok görevli çok yönlülük sunan eksiksiz bir ML hattı sağlar. İster bir Raspberry Pi'de envanter takibi yap, ister bulutta ağır analitikler çalıştır; YOLO26 gibi modeller, bilgisayarlı görünün geleceği için ideal performans dengesini sunar.

Yorumlar