İçeriğe geç

YOLOv8 vs YOLOv7: Kapsamlı Bir Teknik Karşılaştırma

Nesne algılama modellerinin gelişimi hızlı olmuştur ve YOLO (You Only Look Once) ailesi gerçek zamanlı performansta başı çekmektedir. Arasında seçim yapmak YOLOv8 ve YOLOv7 sadece ham metriklerini değil, aynı zamanda onları çevreleyen mimari felsefeleri, geliştirici deneyimini ve ekosistem desteğini de anlamayı içerir. YOLOv7 piyasaya sürüldüğünde etkileyici ölçütler belirlerken, Ultralytics YOLOv8 kullanılabilirlik ve çok yönlülükte bir paradigma değişikliği getirdi.

Bu kılavuz, geliştiricilerin ve araştırmacıların bilgisayarla görme projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla ayrıntılı bir teknik analiz sunmaktadır.

Performans Analizi

Performansı karşılaştırırken, çıkarım hızı ile tespit doğruluğu arasındaki dengeye bakmak çok önemlidir (mAP). YOLOv8 genellikle benzer model boyutları için daha yüksek doğruluk ve modern donanımlarda daha hızlı çıkarım hızları sağlayarak üstün bir denge sunar.

Aşağıdaki tablo COCO veri setindeki performans farklılıklarını vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Temel Çıkarımlar

  • Verimlilik: Bu YOLOv8n (nano) modeli olağanüstü hızlara ( GPU'da 1,47 ms) ulaşarak gecikmenin kritik olduğu uç yapay zeka uygulamaları için idealdir.
  • Doğruluk:YOLOv8xYOLOv7x 'i doğruluk açısından geride bırakırken (%53,9'a karşı %53,1 mAP) rekabetçi parametre sayısını da koruyor.
  • Optimizasyon: YOLOv8 modelleri daha iyi parametre verimliliği göstererek FLOP başına daha yüksek performans sunar ve bu da çıkarım sırasında daha düşük enerji tüketimi anlamına gelir.

Ultralytics YOLOv8: Modern Standart

Ultralytics tarafından 2023'ün başlarında piyasaya sürüldü, YOLOv8 sadece performans açısından değil, aynı zamanda esneklik ve kullanım kolaylığı açısından da son teknoloji ürünü (SOTA) olacak şekilde tasarlanmıştır. Birden fazla bilgisayarla görme görevini tek ve modern bir çerçevede birleştirir.

Mimarlık ve İnovasyon

YOLOv8 , manuel çapa kutusu hesaplamalarına olan ihtiyacı ortadan kaldırarak eğitim sürecini basitleştiren çapasız bir algılama mekanizması sunar. Bu, kutu tahminlerinin sayısını azaltır ve Maksimum Olmayan Bastırmayı (NMS) hızlandırır.

Mimari, üst düzey özellikleri bağlamsal bilgilerle önceki iterasyonlardan daha etkili bir şekilde birleştiren C2f modülüne (iki konvolüsyonlu Aşamalı Kısmi Darboğaz) sahiptir. Bu, daha zengin gradyan akışına ve gelişmiş öğrenme yakınsamasına yol açar. Ayrıca YOLOv8 , daha yüksek doğruluk için nesnellik, sınıflandırma ve regresyon görevlerini bağımsız olarak işleyen ayrıştırılmış bir kafa kullanır.

Güçlü Yönler

YOLOv8 hakkında daha fazla bilgi edinin

YOLOv7: Verimlilikte Bir Ölçüt

YOLOv7 , çıkarım maliyetini artırmadan doğruluğu artırmak için "serbest çantalar "a odaklanan mimari optimizasyonlar sunarak piyasaya sürüldüğünde önemli dalgalar yarattı.

Mimari ve Yaklaşım

YOLOv7 , ağın daha fazla özelliği verimli bir şekilde öğrenmesini sağlamak için en kısa ve en uzun gradyan yollarını kontrol eden Genişletilmiş Verimli Katman Toplama Ağı'nı (E-ELAN) kullanır. Model ölçeklendirmeyi (derinlik ve genişliği aynı anda değiştirme) yoğun bir şekilde vurgular ve çıkarım sırasında katmanları birleştirmek için yeniden parametrelendirme teknikleri sunarak eğitim doğruluğunu kaybetmeden modeli hızlandırır.

Güçlü Yönler ve Sınırlamalar

YOLOv7 , özellikle GPU cihazlarında mükemmel hız/doğruluk oranları sunan güçlü bir modeldir. "Çantada keklik" yaklaşımı, modelin dağıtım sırasında hafif kalmasını sağlar. Bununla birlikte, YOLOv8 ile karşılaştırıldığında, kullanıma hazır birleşik çoklu görev desteğinden yoksundur ve depoları klonlamayı ve bağımlılıkları manuel olarak yönetmeyi içeren daha karmaşık kurulum prosedürleri gerektirir. Öncelikle bir nesne algılama uzmanıdır ve diğer görevler genellikle ayrı dallar veya uygulamalar gerektirir.

YOLOv7 hakkında daha fazla bilgi edinin

Derinlemesine Teknik Karşılaştırma

Kullanılabilirlik ve Ekosistem

En belirgin farklardan biri Kullanım Kolaylığı'nda yatmaktadır. Ultralytics YOLOv8 , standart bir Python kütüphanesi olarak paketlenmiştir. Bu, geliştiricilerin minimum kodla mevcut boru hatlarına entegre edebileceği anlamına gelir. Buna karşılık, YOLOv7 tipik olarak klonlanması ve değiştirilmesi gereken bağımsız bir kod tabanı olarak çalışır.

Geliştirici Deneyimi

YOLOv8 , bir modelin sadece üç satır Python koduyla eğitilmesini sağlar. Bu kolaylaştırılmış kullanıcı deneyimi, yapay zeka çözümleri için pazara sunma süresini önemli ölçüde azaltır.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100)

Görev Çok Yönlülüğü

Modern bilgisayarla görme projeleri genellikle sınırlayıcı kutulardan daha fazlasını gerektirir.

  • YOLOv8: Gerçek bir çoklu görev modeli. Algılama işleminden segmentasyon veya poz tahmini sadece model ağırlık dosyasını değiştirerek (örn, yolov8n-seg.pt).
  • YOLOv7: Öncelikli olarak tespit üzerine odaklanmıştır. Uzantılar mevcut olsa da, tek bir birleşik çerçeve içinde sıkı bir şekilde entegre edilmemiş veya sürdürülmemiştir.

Eğitim Verimliliği ve Hafıza

YOLOv8 eğitim sırasında bellek gereksinimlerini optimize eder. Hassasiyeti iyileştirmek için eğitimin sonuna doğru kapanan akıllı veri artırma stratejileri uygular. Ayrıca, Ultralytics çerçevesi çeşitli veri kümesi formatlarını destekler ve standart veri kümelerinin otomatik olarak indirilmesini sağlayarak eğitim verimliliğini önemli ölçüde artırır.

Transformatör tabanlı modeller genellikle büyük miktarda CUDA belleği gerektirir ve yavaş çalışır. Buna karşılık, hem YOLOv7 hem de YOLOv8 CNN tabanlı ve verimlidir, ancak YOLOv8'in modern mimari seçimleri (C2f bloğu gibi) genellikle tüketici sınıfı donanımlarda daha hızlı yakınsama ve daha iyi bellek verimliliği sağlar.

Gerçek Dünya Kullanım Durumları

Perakende ve Envanter Yönetimi

Perakende analitiği için hız çok önemlidir. YOLOv8n envanteri gerçek zamanlı olarak track için kameralar veya NVIDIA Jetson modülleri gibi uç cihazlarda çalışabilir. Yüksek çıkarım hızı, hareketli ürünlerin gecikme olmadan doğru bir şekilde sayılmasını sağlar.

Otonom Sistemler ve Robotik

Robotik, hassas uzamsal anlayış gerektirir. YOLOv8'in segmentasyon yetenekleri, robotların sadece bir sınırlayıcı kutu yerine engellerin tam şeklini ayırt etmelerini sağlar. Bu çok yönlülük navigasyon güvenliğini artırır. YOLOv7 yetenekli olsa da, segmentasyonu uygulamak daha fazla çaba ve farklı kod tabanları gerektirir.

Tarım

Hassas tarımda, modeller mahsul hastalıklarını detect veya büyümeyi izler. Ultralytics 'in bakımlı ekosistemi, araştırmacıların özellikle bu niş veri kümeleri için önceden eğitilmiş ağırlıklara ve topluluk eğitimlerine erişebilecekleri anlamına gelir ve giriş engelini azaltır.

Sonuç

YOLOv7 , bilgisayarla görme tarihinde saygın ve güçlü bir mimari olmaya devam ederken, Ultralytics YOLOv8 modern geliştirme için üstün bir seçimi temsil ediyor. Son teknoloji performans, eşsiz çok yönlülük ve geliştirici öncelikli bir ekosistemin birleşimi, onu hem akademik araştırma hem de kurumsal dağıtım için başvurulacak çözüm haline getirmektedir.

Ultralytics , verimlilik ve mimari iyileştirmede mutlak en son teknolojiyi arayanlar için de şunları yayınladı YOLO11Bu da sınırları daha da zorluyor. Bununla birlikte, v7 nesli ile doğrudan bir karşılaştırma yapıldığında, YOLOv8 sağlam, güvenilir ve kullanımı kolay bir kazanan olarak öne çıkıyor.

Daha Fazla Okuma

YOLO ortamına ilişkin anlayışınızı derinleştirmek için diğer model karşılaştırmalarını keşfedin:


Yorumlar