İçeriğe geç

YOLOv6.0 ile YOLOv5: Gerçek Zamanlı Nesne Algılayıcılarının Teknik Karşılaştırması

Gerçek zamanlı nesne algılama alanında hızlı bir gelişme yaşanmış ve birçok mimari hız ve doğruluk açısından en üst sıraya yerleşmek için rekabet etmiştir. Bu yolculuktaki iki önemli dönüm noktası YOLOv6.YOLOv6 ve YOLOv5'dir. Her ikisi de "YOLO" (You Only Look Once) soyunu paylaşsa da, tasarım felsefelerinde, optimizasyon hedeflerinde ve kullanım amaçlarında önemli farklılıklar bulunmaktadır.

Bu kılavuz, bu iki modelin derinlemesine teknik analizini sunarak, geliştiricilerin ve mühendislerin bilgisayar görme uygulamaları için doğru aracı seçmelerine yardımcı olur. Mimari farklılıklarını, karşılaştırmalı performanslarını ve Ultralytics gibi modern çözümlerle karşılaştırıldığında nasıl bir performans sergilediklerini inceleyeceğiz.

Performans Metriklerine Genel Bakış

Aşağıdaki tablo, nesne algılama için standart bir ölçüt olan COCO inde her iki modelin performansını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv6.0: Endüstriyel Ağır Sıklet

Genellikle "YOLOv6 .0: Tam Ölçekli Yeniden Yükleme" olarak anılan YOLOv6.YOLOv6, Meituan araştırmacıları tarafından geliştirilmiştir. Ocak 2023'te piyasaya sürülen bu ürün, özel donanımların (özellikle NVIDIA ) mevcut olduğu endüstriyel uygulamalar için özel olarak tasarlanmıştır.

Mimari ve Tasarım

YOLOv6 , RepVGG'den backbone büyük ölçüde değiştirilmiş bir backbone YOLOv6 . Bu mimari, yapısal yeniden parametreleştirme kullanır ve modelin eğitim sırasında karmaşık çok dallı bir topolojiye sahip olmasını, ancak çıkarım sırasında basit, yüksek hızlı 3x3 konvolüsyon yığınına dönüşmesini sağlar.

Temel özellikler şunları içerir:

  • Çapa İçermeyen Tasarım: Çapa kutusu hiperparametre ayarlamasının karmaşıklığını ortadan kaldırarak eğitim sürecini basitleştirir.
  • SimOTA Etiket Atama: Yer gerçeği nesnelerini tahminlerle dinamik olarak eşleştiren ve yakınsamayı iyileştiren gelişmiş bir etiket atama stratejisi.
  • Kuantizasyon Farkındalığı: Model, Kuantizasyon Farkındalıklı Eğitim (QAT) göz önünde bulundurularak oluşturulmuştur ve TensorRT üzerinde dağıtım için INT8'e dönüştürülürken minimum doğruluk kaybı sağlar.

Güçlü ve Zayıf Yönler

YOLOv6ın en büyük gücü, GPU'larda elde ettiği ham verimdir. Donanım dostu işlemler için optimize edilerek, Tesla T4 gibi cihazlarda etkileyici FPS değerleri elde eder. Ancak bu uzmanlık bir bedeli de beraberinde getirir. Yeniden parametrelendirilmiş mimari, bellek bant genişliğinin darboğaz oluşturduğu CPU'larda veya mobil cihazlarda daha az verimli olabilir. Ayrıca, Ultralytics sunduğu birleşik deneyime kıyasla ekosistemi daha parçalıdır.

YOLOv6 hakkında daha fazla bilgi edinin.

YOLOv5: Çok Yönlü Standart

YOLOv5, Glenn Jocher ve Ultralytics tarafından yaratılan, nesne algılamanın erişilebilirliğinde devrim yarattı. Haziran 2020'de piyasaya sürüldüğünden bu yana, "sıfırdan kahramana" basitliğiyle tanınan, küresel olarak en yaygın kullanılan görsel yapay zeka modellerinden biri haline geldi.

Mimari ve Tasarım

YOLOv5 , özellik çıkarma yetenekleri ile hesaplama verimliliği arasında denge sağlayan CSPDarknet backboneYOLOv5 . Focus katmanı (erken sürümlerde) ve SiLU aktivasyon fonksiyonlarının yaygın kullanımı gibi, günümüzde standart hale gelen birçok yeniliği getirmiştir.

Temel özellikler şunları içerir:

  • Kullanıcı Odaklı Ekosistem: YOLOv5 sadece bir model YOLOv5 , eksiksiz bir çerçevedir. Veri artırma, hiperparametre evrimi ve dağıtım için sorunsuz entegrasyonlar içerir.
  • Geniş Donanım Desteği: Yalnızca üst düzey GPU'lar için optimize edilmiş modellerin aksine, YOLOv5 CPU'lar, Raspberry Pi gibi uç cihazlar ve mobil yonga setleri üzerinde TFLite.
  • Çoklu Görev Yetenekleri: Basit algılamanın ötesinde, YOLOv5 örnek segmentasyonu ve sınıflandırmayı YOLOv5 karmaşık projeler için esnek bir seçim olmasını sağlar.

Güçlü ve Zayıf Yönler

YOLOv5 , çok yönlülük ve kullanım kolaylığı açısından YOLOv5 . Eğitim sırasında bellek gereksinimleri birçok rakibinden belirgin şekilde daha düşüktür, bu da kullanıcıların tüketici sınıfı GPU'larda eğitim yapabilmelerini sağlar. Daha yeni modeller belirli donanımlarda saf benchmark ölçümlerinde üstünlük sağlayabilirken, YOLOv5 genel amaçlı uygulamalar için sağlam, savaşta test edilmiş bir çözüm YOLOv5 .

YOLOv5 hakkında daha fazla bilgi edinin.

İdeal Kullanım Örnekleri

Ne Zaman YOLOv6-3.0 Seçmeli

YOLOv6-3.0, kesinlikle endüstriyel ortamlarda güçlü bir rakiptir:

  • Özel GPU : Dağıtım ortamı yalnızca NVIDIA (T4, V100 veya Jetson Orin gibi) ve TensorRTkullanır.
  • Verimlilik çok önemlidir: Yüksek hızlı üretim hattı denetimi gibi senaryolarda, belirli donanımlarda milisaniyelik gecikme süresi başarının tek ölçütüdür.

YOLOv5 Ne Zaman Tercih Edilmeli?

YOLOv5 , daha geniş bir uygulama yelpazesi için üstün bir seçim YOLOv5 :

  • Kenar ve CPU : Raspberry Pi, cep telefonları veya CPU bulut örnekleri gibi cihazlar için YOLOv5 mimarisi daha iyi uyumluluk ve hız sunar.
  • Hızlı Prototipleme: Kolay eğitim ve kapsamlı dokümantasyon, geliştiricilerin veri setinden dağıtılmış modele saatler içinde geçmelerini sağlar.
  • Kaynak Kısıtlı Eğitim: Sınırlı donanımla (örneğin, 8 GB VRAM GPU tek bir GPU ) eğitim yapıyorsanız, YOLOv5 verimliliği eşsizdir.

Ultralytics : Modelin Ötesinde

Mimarinin önemi büyük olsa da, bir modeli çevreleyen ekosistem genellikle projenin başarısını belirler. YOLOv5 onun ardılları da dahil olmak üzere Ultralytics , belirgin avantajlar sunar:

  1. Kullanım Kolaylığı: Ultralytics Python , eğitim, doğrulama ve çıkarım işlemlerini birleştirir. YOLOv5, YOLO11veya YOLO26 arasında geçiş yapmak için kodunuzda tek bir dizeyi değiştirmeniz yeterlidir.
  2. İyi Bakımlı Ekosistem: Aktif geliştirme, sık güncellemeler ve canlı bir topluluk, hataların hızlı bir şekilde giderilmesini ve yeni özelliklerin ( Dünya modelleri gibi) sorunsuz bir şekilde entegre edilmesini sağlar.
  3. Eğitim Verimliliği: Ultralytics , eğitim verimliliğine Ultralytics , özel verilere hızla uyum sağlayan optimize edilmiş önceden eğitilmiş ağırlıklar sağlar.
  4. Platform Entegrasyonu: Ultralytics , veri kümelerini yönetmek, bulutta modeller eğitmek ve altyapıyı yönetmeden çeşitli uç noktalara dağıtmak için kod gerektirmeyen bir çözüm sunar.

Sorunsuz Entegrasyon

Ultralytics , tek tıklamayla ONNX, CoreML, OpenVINOve TensorRT, dağıtım için gereken mühendislik çabasını önemli ölçüde azaltır.

Öneri: Gelecek YOLO26'dır

2026 yılında yeni projeler başlatan geliştiriciler için, eski modellerin ötesine geçerek Ultralytics incelemenizi şiddetle tavsiye ederiz.

YOLO26, verimlilik ve doğrulukta zirveyi temsil eder. Çığır açan tasarımıyla hem YOLOv5 hız/doğruluk dengesi) hem de YOLOv6 donanım katılığı) sınırlamalarını ortadan kaldırır.

  • Yerel olarak uçtan uca: YOLO26, dağıtımı karmaşıklaştıran ve gecikmeye neden olan bir son işlem adımı olan Maksimum Baskı Dışı Bırakma (NMS) ihtiyacını ortadan kaldırır. Bu, iş akışını daha basit ve hızlı hale getirir.
  • CPU : Dağıtım Odak Kaybı (DFL) ve belirli mimari ayarlamaların kaldırılmasıyla YOLO26, CPU'larda %43'e varan daha hızlı çıkarım elde ederek uç bilgi işlem için ideal hale gelir.
  • MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitimindeki yeniliklerden esinlenerek geliştirilen yeni MuSGD optimizer, daha küçük veri kümelerinde bile istikrarlı eğitim dinamikleri ve daha hızlı yakınsama sağlar.
  • Geliştirilmiş Küçük Nesne Algılama: ProgLoss ve STAL işlevlerinin eklenmesi, hava görüntüleme ve uzaktan algılama görevleri için kritik öneme sahip olan küçük nesneler üzerinde performansı önemli ölçüde artırır.

YOLO26 hakkında daha fazla bilgi edinin

Kod Örneği

Ultralytics , model nesilleri arasında tutarlı olacak şekilde tasarlanmıştır. YOLOv5 önerilen YOLO26 kullanıyor olsanız da, çıkarımları ne kadar kolay yükleyip çalıştırabileceğinizi burada görebilirsiniz.

from ultralytics import YOLO

# Load the recommended YOLO26 model (or YOLOv5)
# Switch to 'yolov5s.pt' to use YOLOv5
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# The predict method returns a list of Result objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    result.show()  # Display result to screen
    result.save(filename="result.jpg")  # Save result to disk

Diğer son teknoloji özelliklerle ilgilenen kullanıcılar, açık sözlük algılama için YOLO veya RT-DETR 'yi keşfetmeyi düşünün.

Sonuç

Hem YOLOv6.0 hem de YOLOv5 , bilgisayar görüşünün gelişmesinde önemli roller oynamıştır. YOLOv6 , GPU sınırlarını YOLOv6 , YOLOv5 ise güçlü AI araçlarına erişimi YOLOv5 . Ancak, bu alan hızla gelişmektedir. YOLO26 ile Ultralytics , her iki dünyanın en iyi özelliklerini Ultralytics : donanım uyumlu tasarımın hızı, uçtan uca boru hattının basitliği ve kapsamlı bir ekosistemin çok yönlülüğü. İster fabrika zemininde ister mobil uygulamada kullanın, Ultralytics ölçeklenebilir ve sürdürülebilir AI çözümleri oluşturmak için en iyi seçenek olmaya devam ediyor.


Yorumlar