İçeriğe geç

YOLOv7 YOLO: Mimari Yenilik ve Hız Arasındaki Denge

Gerçek zamanlı nesne algılama alanında, 2022 yılında YOLOv7 ve YOLO piyasaya sürülmesiyle önemli değişiklikler yaşadı. Her iki model de doğruluk ve gecikme süresini sınırlarını zorlamayı amaçladı, ancak bu zorluğa temelde farklı mühendislik perspektiflerinden yaklaştı. YOLOv7 , "bag-of-freebies" yaklaşımıyla eğitim sürecini optimize etmeye YOLOv7 ,YOLO , Neural Architecture Search (NAS)YOLO verimli yapıları otomatik olarak keşfetmeyi amaçladı.

Bu kapsamlı karşılaştırma, mimarilerini, performans ölçütlerini ve eğitim metodolojilerini inceleyerek, belirli bilgisayar görme uygulamalarınıza en uygun modeli seçmenize yardımcı olur. Her ikisi de eski projeler için geçerliliğini korusa da, YOLO26 gibi modern çözümlerin neden yeni geliştirmeler için önerilen standart haline geldiğini de ele alacağız.

YOLOv7: Eğitilebilir "Bag-of-Freebies"

Temmuz 2022'de piyasaya sürülen YOLOv7 , YOLO önemli bir dönüm noktası YOLOv7 ve çıkarım maliyetlerini artırmadan doğruluğu artıran mimari reformlara odaklandı.

Mimari Yenilikler

YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) özelliğini YOLOv7 . En kısa ve en uzun gradyan yollarını kontrol eden standart ELAN'dan farklı olarak, E-ELAN genişletme, karıştırma ve birleştirme kardinalitesini kullanarak orijinal gradyan yolunu bozmadan ağın öğrenme yeteneğini geliştirir. Bu tasarım, modelin daha çeşitli özellikleri öğrenmesini sağlayarak, aşağıdaki gibi karmaşık veri kümelerinde performansı artırır COCOgibi karmaşık veri kümelerinde performansı artırır.

YOLOv7 temel kavramlarından biri "eğitilebilir bag-of-freebies" YOLOv7 . Bunlar, doğruluğu artırmak için eğitim maliyetlerini artıran ancak çıkarım sırasında herhangi bir ceza getirmeyen model yeniden parametreleştirme ve dinamik etiket atama gibi optimizasyon yöntemleridir. Bu, YOLOv7 tıbbi görüntü analizi veya güvenlik açısından kritik endüstriyel denetim gibi yüksek hassasiyet gerektiren senaryolar için mükemmel YOLOv7 seçim haline getirir.

YOLOv7 hakkında daha fazla bilgi edinin.

Alibaba Group tarafından geliştirilenYOLO daha sonra DAMO-Academy'nin vizyon paketine entegre edildi), hız ve düşük gecikmeyi önceliklendirerek, özellikle milisaniye düzeyinde katı kısıtlamaların uygulandığı endüstriyel uygulamaları hedefledi.

MAE-NAS ve Damıtma

YOLO mimarisi, MAE-NAS (Verimlilik Otomasyon Yöntemi-Sinirsel Mimari Arama) adı verilen bir yöntem kullanılarak geliştirilmiştir. Bu otomatik süreç, belirli gecikme bütçeleri altında algılama performansını en üst düzeye çıkaran backbone bulmuştur. Ayrıca, verimli özellik birleştirme için RepGFPN (Rep-parametreli Genelleştirilmiş Özellik Piramit Ağı) ve hafif bir algılama başlığı olan ZeroHead'i de tanıtmıştır.

YOLO ayırt edici bir özelliğiYOLO damıtmaya büyük ölçüdeYOLO . Modeller genellikle daha büyük bir "öğretmen" modelin yardımıyla eğitilir ve bu model, "öğrenci" modelin daha iyi temsilleri öğrenmesini sağlar. Bu, etkileyici bir verimlilik sağlasa da, standart nesne algılama iş akışlarına kıyasla eğitim sürecini önemli ölçüde karmaşıklaştırır.

Performans Karşılaştırması

Aşağıdaki tablo, YOLOv7 YOLO performanslarını karşılaştırmaktadır. YOLOv7 daha yüksek doğruluk (mAP) sağlarken,YOLO hız için optimize edilmiş son derece hafif modellerYOLO .

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Karşılıklı ödünlerin analizi

  • Doğruluk:YOLOv7x, %53,1'lik mAP lider konumdadır ve bu da onu, algılamayı kaçırmanın maliyetli olduğu görevler için uygun hale getirir.
  • Hız:DAMO-YOLOt inanılmaz derecede hızlıdır ( TensorRT'de 2,32 ms), yüksek FPS videoların anlaşılması veya kısıtlı kenar cihazlarda dağıtım için idealdir.
  • Karmaşıklık: YOLOv7 parametreleri ve FLOP'ları, saf verimlilikten çok kapasiteye odaklandığını yansıtan şekilde önemli ölçüde daha yüksektir.

Eğitim Karmaşıklığı Notu

YOLO mükemmel hız-doğruluk dengesiYOLO , sonuçlarını özel veri kümelerinde yeniden üretmek zor olabilir. Eğitim yöntemi genellikle damıtma için ağır bir öğretmen modeli içeren çok aşamalı bir süreç gerektirirken, YOLOv7 uygulaması daha kolay olan basit bir "sıfırdan eğitim" metodolojisi YOLOv7 .

Neden Ultralytics YOLO26 Üstün Bir Seçimdir

YOLOv7 YOLO kendi dönemlerinde etkiliYOLO olsa da, bu alan hızla gelişmiştir. 2026 yılında yeni projeler başlatan geliştiriciler ve araştırmacılar için YOLO26, yüksek doğruluk ile basitleştirilmiş dağıtımı birleştirerek her iki öncülünden de daha üstün bir performans gösteren birleşik bir çözüm sunar.

Rakipsiz Kullanım Kolaylığı ve Ekosistem

Ultralytics , kullanıcı dostu tasarımıyla tanınır.YOLO karmaşık damıtma boru hatlarından farklı olarak, YOLO26 veri etiketlemeden model dağıtımına kadar her şeyi yöneten basitleştirilmiş bir Python sunar.

  • Eğitim Verimliliği: Karmaşık öğretmen-öğrenci kurulumları olmadan, birkaç satırlık kodla en son teknolojiye sahip modelleri eğitin.
  • İyi Bakımlı: Sık güncellemeler, kapsamlı belgeler ve aktif topluluk desteği, projenizin geleceğe hazır olmasını sağlar.
  • Çok yönlülük: Algılama ötesinde, YOLO26 doğal olarak örnek segmentasyonu, poz tahmini, sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) özelliklerini destekler.

YOLO26 Teknik Atılımlar

YOLO26, eski mimarilerin sınırlamalarını çözen birkaç önemli yenilik sunar:

  1. Uçtan Uca NMS Tasarım: Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak, YOLO26 çıkarım gecikmesini azaltır ve dışa aktarım mantığını basitleştirir. Bu özellik, hem YOLOv7 standartYOLO bulunmamaktadır.
  2. MuSGD Optimizer: LLM eğitimi (Kimi K2 gibi) esinlenerek geliştirilen bu hibrit optimizer, daha hızlı yakınsama ve istikrarlı eğitim için SGD Muon'u birleştirir.
  3. Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) ve belirli CPU kaldırılması, YOLO26'yı önceki nesillere kıyasla CPU çıkarımında %43'e kadar daha hızlı hale getirerek,YOLO hedeflediği düşük gecikme süresi ihtiyaçlarını karşılıyor.
  4. ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, drone görüntüleme ve robotik için kritik bir özellik olan küçük nesne algılamasını iyileştirir.

YOLO26 hakkında daha fazla bilgi edinin

Kod Örneği: Ultralytics ile Eğitim

Bu örnek, Ultralytics kullanarak modern bir YOLO26 modelini eğitmenin ne kadar kolay olduğunu göstermektedir. Bu tek arayüz, eski depoların gerektirdiği karmaşık yapılandırma dosyalarını ve çok aşamalı ardışık düzenleri ortadan kaldırmaktadır.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended over YOLOv7/DAMO-YOLO)
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

# Export to ONNX for deployment
model.export(format="onnx")

Sonuç

Hem YOLOv7 YOLO , bilgisayar görüşünün gelişimine önemliYOLO . YOLOv7 , akıllı eğitim stratejileriyle el yapımı mimarilerin hala SOTA sonuçları elde edebileceğini YOLOv7 ,YOLO gecikme kısıtlaması olan ortamlarda NAS'ın gücünüYOLO .

Ancak, günümüzün pratik ve gerçek dünya uygulamaları için YOLO26 kesin bir tercihtir. Yüksek doğruluk ve hız arasında performans dengesi sunar, Transformers'a kıyasla eğitim sırasında çok daha düşük bellek gereksinimleri vardır ve Ultralytics sağlam desteğini alır. İster uç ister bulut için geliştirme yapıyor olun, YOLO26'nın uçtan uca tasarımı ve çok yönlü görev desteği, üretime en verimli yolu sunar.

Daha Fazla Okuma


Yorumlar