İçeriğe geç

YOLOv8 ve YOLOv9: Gerçek Zamanlı Nesne detect Modellerinin Kapsamlı Teknik Karşılaştırması

Gerçek zamanlı nesne detect gelişimini, daha iyi doğruluk, daha düşük gecikme süresi ve geliştirilmiş donanım kullanımı için sürekli bir çaba karakterize etmiştir. Bu yolculuktaki iki önemli kilometre taşı Ultralytics YOLOv8 ve YOLOv9'dur. Her iki model de bilgisayar görüşünde son teknoloji yetenekleri temsil etse de, farklı dağıtım ihtiyaçlarına, mimari felsefelere ve geliştirici ekosistemlerine hitap etmektedirler.

Bu kapsamlı kılavuz, bir sonraki yapay zeka projeniz için doğru modeli seçmenize yardımcı olmak amacıyla teknik farklılıkları, mimari yenilikleri ve pratik dağıtım hususlarını detaylandırmaktadır.

Model Soy Ağacı ve Temel Felsefeler

Metriklere geçmeden önce, her bir modelin kökenlerini ve birincil tasarım hedeflerini anlamak çok önemlidir.

Ultralytics YOLOv8: Çok Yönlü Ekosistem Standardı

Ultralytics ekibi tarafından yayınlanan YOLOv8, yalnızca bağımsız bir nesne detect modeli olarak değil, birleşik, çok görevli bir çerçeve olarak tasarlanmıştır. Sorunsuz bir geliştirici deneyimini, düşük bellek gereksinimlerini ve geniş donanım uyumluluğunu önceliklendirir.

YOLOv8 hakkında daha fazla bilgi edinin.

YOLOv9: Programlanabilir Gradyan Bilgisi

Academia Sinica'daki araştırmacılar tarafından bağımsız olarak geliştirilen YOLOv9, mimari teoriye yoğun bir şekilde odaklanmakta, özellikle derin sinir ağlarındaki bilgi darboğazı fenomenini ele almaktadır.

  • Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
  • Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
  • Tarih: 2024-02-21
  • Arxiv:2402.13616
  • GitHub:WongKinYiu/yolov9

YOLOv9 hakkında daha fazla bilgi edinin.

Kurumsal Dağıtım

Büyük ölçekli bir ticari dağıtım planlıyorsanız, basitleştirilmiş bulut eğitimi, veri kümesi yönetimi ve tek tıklamayla API uç noktaları için Ultralytics Platformunu keşfetmeyi düşünebilirsiniz.

Mimari Derinlemesine İnceleme

Derin öğrenmedeki mimari seçimler, bir modelin ne kadar verimli öğrendiğini ve NVIDIA Jetson veya Intel CPU gibi hedef donanımlarda ne kadar hızlı çalıştığını belirler.

YOLOv8 Mimarisi: C2f ve Ayrık Başlıklar

YOLOv8, eski C3 modülünün yerini alan C2f modülünü (iki evrişimli Çapraz Aşamalı Kısmi darboğaz) tanıttı. Bu değişiklik, gradyan akışını iyileştirir ve ağın GPU belleğini aşırı zorlamadan daha zengin özellik temsilleri öğrenmesini sağlar.

Ayrıca, YOLOv8, anchor-free bir tasarıma ve ayrık bir başlığa sahiptir. Nesne tespiti, sınıflandırma ve regresyonu ayrı yollarla işleyerek model, eğitim sırasında daha hızlı yakınsar ve çeşitli özel veri kümelerine daha iyi genelleşir.

YOLOv9 Mimarisi: PGI ve GELAN

YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) özelliklerini sunar. PGI, kritik verilerin ağ katmanlarından geçerken kaybolmamasını sağlayarak ağırlık güncellemeleri için güvenilir gradyanlar sunar. GELAN, parametre verimliliğini en üst düzeye çıkararak modelin FLOP'ları yönetilebilir tutmaya çalışırken yüksek accuracy elde etmesini sağlar.

Matematiksel olarak etkileyici olsa da, YOLOv9'un eğitim sırasında belirli yardımcı tersine çevrilebilir dallara bağımlılığı, eğitim kodunu standart işlem hatlarına kıyasla özelleştirmeyi daha karmaşık hale getirebilir.

Performans Metrikleri ve Kıyaslamalar

Aşağıdaki tablo, modellerin farklı boyutlardaki doğrudan karşılaştırmasını sunar. Performans, nesne detect için standart bir karşılaştırma ölçütü olan MS COCO veri kümesi üzerinde ölçülmüştür.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Not: Her sütundaki en iyi değerler kalın olarak vurgulanmıştır.

Ödünleşimleri Analiz Etme

YOLOv9, özellikle daha büyük varyantıyla, biraz daha yüksek tepe doğruluk (mAP) elde eder. e varyantı. Ancak, bu bir maliyetle gelir. Ultralytics YOLOv8, önemli bir avantaja sahiptir Çıkarım hızı, özellikle gibi formatlara derlendiğinde TensorRT veya ONNX. Kısıtlı uç donanımlarda (bir Raspberry Pi veya eski mobil çiplerde), YOLOv8'in n ve s varyantları çok daha pratik bir performans dengesi sunar.

Eğitim Verimliliği ve Ekosistem Entegrasyonu

Bir model seçmek, sadece doğruluk tablolarına bakmaktan daha fazlasını gerektirir; geliştirici deneyimi çok önemlidir.

Ultralytics Avantajı: Kullanım Kolaylığı

YOLOv9'u eğitmek genellikle karmaşık GitHub depolarını klonlamayı, PyTorch ortamlarını dikkatlice yönetmeyi ve yardımcı kayıp ağırlıklarını manuel olarak yapılandırmayı gerektirir.

Buna karşılık, Ultralytics YOLOv8, oldukça akıcı bir Python API'si ile desteklenmektedir. Kullanım kolaylığı için tasarlanan bu API, veri artırma, günlükleme (Weights & Biases ve Comet ML gibi araçlara) ve donanım dağıtımını yerel olarak yönetir.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)

# Export for edge deployment
model.export(format="engine", half=True)  # TensorRT export

Bu tek API, prototipten üretime geçiş süresini önemli ölçüde azaltır. Ayrıca, YOLOv8 genellikle eğitim sırasında daha düşük CUDA belleği gerektirir, bu da geliştiricilerin tüketici sınıfı donanımlarda daha büyük toplu iş boyutları kullanmasına olanak tanır.

Görev Çok Yönlülüğü

YOLOv9 mükemmel bir sınırlayıcı kutu dedektörü olsa da, gerçek dünya yapay zekası genellikle daha fazlasını gerektirir. YOLOv8, Örnek Segmentasyonu, Poz Tahmini, Görüntü Sınıflandırması ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) yerel olarak destekleyen çok yönlü bir güç merkezidir. Birden fazla görev için tek bir çerçeve kullanmak, yazılım şişkinliğini ve bakım yükünü önemli ölçüde azaltır.

Geleceğe Bakış

Yeni bir projeye başlıyorsanız, uçtan uca NMS içermeyen tasarımlara sahip olan Ultralytics YOLO11 veya son teknoloji YOLO26'yı da değerlendirmek isteyebilirsiniz.

Gerçek Dünya Kullanım Durumları

Bu modeller üretimde nasıl bir performans sergiliyor?

Otonom Drone'lar ve Robotik

Hızlı engel kaçınma gerektiren robotik uygulamalar için, YOLOv8 tercih edilen seçenektir. Ultra düşük gecikme süresi, YOLOv8n otonom sistemlerin çevrelerine gerçek zamanlı tepki vermesini sağlayarak çarpışmaları önler. Yerel dışa aktarma yetenekleri, OpenVINO ve CoreML, ticari dronlarda tipik olan düşük güçlü çiplerde dağıtımı kolaylaştırır.

Yüksek Çözünürlüklü Kusur detect

Mikroskobik anormalliklerin tespitinin kritik olduğu ve çevrimdışı işlemenin kabul edilebilir olduğu özel üretim ortamlarında, YOLOv9 oldukça etkili olabilir. PGI mimarisi, ağın kılcal çatlakları veya PCB lehimleme hatalarını tanımlamak için gerekli olan ince taneli görsel detayları korumasına yardımcı olur.

Akıllı Perakendecilik ve Güvenlik Analitiği

Mağaza koridorlarında müşterileri takip etmek veya otomatik ödeme sistemlerini yönetmek için YOLOv8 en iyi dengeyi sağlar. detect ve çoklu nesne takibini BoT-SORT gibi standart algoritmalar kullanarak eş zamanlı olarak çalıştırma yeteneği, onu çok kameralı perakende dağıtımları için sağlam bir çözüm haline getirir.

Kullanım Durumları ve Öneriler

YOLOv8 ve YOLOv9 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.

YOLOv8 Ne Zaman Tercih Edilmeli?

YOLOv8 şunlar için güçlü bir seçenektir:

  • Çok Yönlü Çok Görevli Dağıtım: Ultralytics ekosistemi içinde detect, segment, sınıflandırma ve poz tahmini için kanıtlanmış bir model gerektiren projeler.
  • Yerleşik Üretim Sistemleri: YOLOv8 mimarisi üzerine kurulu, kararlı ve iyi test edilmiş dağıtım hatlarına sahip mevcut üretim ortamları.
  • Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından faydalanan uygulamalar.

YOLOv9 Ne Zaman Tercih Edilmeli?

YOLOv9 şunlar için önerilir:

  • Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) mimarilerini inceleyen akademik projeler.
  • Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
  • Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için bir referans noktası olarak gerektiği senaryolar.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Bir Sonraki Evrim: YOLO26

YOLOv8 ve YOLOv9 güçlü olsa da, yapay zeka alanı hızla ilerlemektedir. En iyi performansı talep eden ekipler için, yeni çıkan YOLO26 bu önceki nesillerin başarıları üzerine inşa edilmiştir.

YOLO26, karmaşık işlem sonrası darboğazları tamamen ortadan kaldıran, dağıtımı basitleştiren ve gecikmeyi daha öngörülebilir hale getiren uçtan uca NMS içermeyen bir tasarım sunar. Yeni MuSGD Optimizer ve geliştirilmiş ProgLoss + STAL kayıp fonksiyonları ile desteklenen ve DFL Removal (basitleştirilmiş dışa aktarım ve daha iyi uç/düşük güçlü cihaz uyumluluğu için Distribution Focal Loss kaldırıldı) ile küçük nesne tanımayı artırırken %43'e kadar daha hızlı CPU çıkarımı elde eder. Uç bilişimin sınırlarını zorlayan geliştiriciler için YOLO26'yı değerlendirmeleri şiddetle tavsiye edilir.

Özetle, YOLOv9 büyüleyici mimari araştırmalar ve mükemmel en yüksek doğruluk sunsa da, Ultralytics YOLOv8, güvenilir yazılımları hızla piyasaya sürmeyi hedefleyen bilgisayar görüşü mühendislerinin büyük çoğunluğu için en pratik, iyi desteklenen ve çok yönlü seçenek olmaya devam etmektedir.


Yorumlar