YOLOv6.0 ile YOLOv8: Modern Nesne Algılama Teknolojisine Teknik Bir Bakış

Hızla gelişen bilgisayar görme alanında, doğru nesne algılama modelini seçmek projenin başarısı için çok önemlidir. Bu karşılaştırma, YOLO iki önemli dönüm noktasını ele almaktadır: Endüstriyel uygulamalar için optimize edilmiş güçlü bir algılayıcı olan YOLOv6.YOLOv6 ve Ultralytics YOLOv8, çok yönlülük, kullanım kolaylığı ve çok çeşitli donanımlarda yüksek performans için tasarlanmış son teknoloji bir model. Dağıtım ihtiyaçlarınıza en uygun modeli seçmenize yardımcı olmak için mimarilerini, performans ölçütlerini ve eğitim metodolojilerini analiz ediyoruz.

Performans Metrikleri Karşılaştırması

Aşağıdaki tablo, her iki modelin temel performans göstergelerini göstermektedir. YOLOv8 , özellikle orta ve büyük model boyutlarında, rekabetçi parametre sayılarını korurken, doğruluk ve hız arasında üstün bir denge sergilemektedir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOv6.0: Endüstriyel Sınıf Hassasiyet

Meituan tarafından Ocak 2023'te piyasaya sürülen YOLOv6.YOLOv6, donanım kısıtlamaları ve verimin çok önemli olduğu endüstriyel uygulamalar için özel olarak tasarlanmıştır. NVIDIA T4 gibi özel GPU'larda çıkarım hızını en üst düzeye çıkarmayı amaçlayan birkaç mimari yenilik sunar.

Temel Mimari Özellikler

Yeniden Parametreleştirilebilir Backbone: Çıkarım sırasında verimli backbone ancak eğitimi karmaşık olabilen VGG tarzı bir backbone kullanır. Bu "RepVGG" yaklaşımı, dışa aktarım sırasında yoğun dal birleştirmeye olanak tanır.
Çift yönlü füzyon: Farklı ölçekler arasında özellik yayılımını geliştirerek, farklı boyutlardaki nesnelerin algılanmasını iyileştirir.
Çapa Destekli Eğitim: Çapa destekli eğitim stratejisi (AAT) kullanarak, çapa içermeyen çıkarımın esnekliğinden ödün vermeden yakınsamayı stabilize eder.

Güçlü Yönler:

Yüksek Verim: Donanım dostu backbone sayesinde GPU son derece hızlıdır.
Kuantizasyon Desteği: Dağıtım için Eğitim Sonrası Kuantizasyon (PTQ) ve Kuantizasyon Duyarlı Eğitim (QAT) üzerine yoğun odaklanma.

Zayıflıklar:

Sınırlı Görev Desteği: Öncelikle nesne algılamaya odaklanmış olup, segmentasyon veya poz tahmini için yerel destekten yoksundur.
Karmaşık Eğitim: Yeniden parametrelendirme süreci, eğitim ve dışa aktarma sürecine karmaşıklık katar.

YOLOv6 hakkında daha fazla bilgi edinin.

Ultralytics YOLOv8: Çok Yönlü Standart

Ultralytics YOLOv8, YOLOv6. YOLOv6 sadece birkaç gün önce piyasaya sürüldü ve kullanılabilirlik ve çok yönlülük açısından önemli bir ilerlemeyi temsil ediyor. Sadece bir model olarak değil, çeşitli bilgisayar görme görevleri için bir platform olarak tasarlandı. YOLOv8 , çapa tabanlı algılama kafasını YOLOv8 çapasız bir yaklaşım benimsedi, model mimarisini basitleştirdi ve genellemeyi iyileştirdi.

Mimari Yenilikler

Anchor-Free Detection: Manuel anchor box yapılandırması ihtiyacını ortadan kaldırarak, hiperparametre ayarlamasını azaltır ve çeşitli veri kümelerinde performansı artırır.
C2f Modülü: Doğruluğu korurken gradyan akışını iyileştiren ve model boyutunu azaltan iki konvolüsyonlu, aşamalar arası kısmi darboğaz.
Ayrıştırılmış Başlık: sınıflandırma ve regresyon görevlerini ayırarak, her bir dalın daha yüksek doğruluk için kendi özel hedefine odaklanmasını sağlar.

YOLOv8'in Avantajları

Çok yönlülük: Nesne algılama, örnek segmentasyonu, poz tahmini, sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) özelliklerini yerel olarak destekler.
Kullanım Kolaylığı: Ultralytics Python , sadece birkaç satır kodla eğitim, doğrulama ve dağıtım yapılmasına olanak tanır.
Eğitim Verimliliği: Birçok transformatör tabanlı alternatiften daha düşük bellek gereksinimleri ile tüketici sınıfı GPU'larda hızlı eğitim için optimize edilmiştir.
Ekosistem: Ultralytics ve Comet gibi araçlarla sorunsuz entegrasyonlar dahil olmak üzere, sağlam Ultralytics tarafından desteklenir.

YOLOv8 hakkında daha fazla bilgi edinin.

Kolaylaştırılmış İş Akışı

YOLOv8 eğitmek son derece basittir. Aşağıdaki kod parçacığı, önceden eğitilmiş bir modeli yüklemeyi ve özel bir veri kümesinde eğitimi başlatmayı gösterir:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Karşılaştırmalı Analiz: Kullanım Örnekleri ve Dağıtım

Bu iki güçlü mimari arasında seçim yaparken, karar genellikle dağıtım ortamınızın özel gereksinimlerine ve gerçekleştirmeniz gereken görevlerin kapsamına bağlıdır.

Gerçek Dünya Uygulamaları

YOLOv6.0 şu alanlarda mükemmeldir:

Yüksek Hızlı Endüstriyel Denetim: Her milisaniyenin önemli olduğu, özel GPU'lar kullanan üretim hatları için ideal.
Sabit Donanım Dağıtımları: Donanımın bilindiği ve özel olarak optimize edildiği senaryolar (ör. NVIDIA sunucuları).

Ultralytics YOLOv8 şunlarda mükemmeldir:

Edge AI ve Mobil: Modelin verimli mimarisi ve TFLite ve CoreML 'e kolay aktarımı, onu iOS Android için mükemmel hale getirir.
Robotik ve Otonom Sistemler: Segmentasyon ve poz tahmini gibi birden fazla görevi aynı anda yerine getirme yeteneği, robotların çevreyi daha iyi anlamasını sağlar.
Hızlı Prototipleme: Kullanım kolaylığı ve kapsamlı dokümantasyon, geliştiricilerin hızlı bir şekilde yineleme yapmalarını ve ürünleri daha hızlı pazara sunmalarını sağlar.

Projelerinizi Geleceğe Hazırlama

Her iki model de mükemmel olsa da, yapay zeka alanı inanılmaz bir hızla gelişmektedir. Performans ve verimlilik açısından en son teknolojiyi gerektiren yeni projelere bugün başlayan geliştiriciler için Ultralytics , YOLO26'yı incelemeyi Ultralytics .

YOLO26, YOLOv8 başarısını temel alarak birkaç çığır açan özelliğe YOLOv8 :

Uçtan uca NMS: Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak, YOLO26 dağıtımı basitleştirir ve gecikme varyansını azaltır.
MuSGD Optimizer: LLM eğitiminden esinlenerek geliştirilen bu optimizer, istikrarlı bir yakınsama sağlar.
Geliştirilmiş Kenar Performansı: Pil ile çalışan cihazlar için kritik öneme sahip CPU %43'e varan hız artışı.
Görev Özgüllüğü: ProgLoss ve STAL gibi özel kayıp fonksiyonları, küçük nesnelerin algılanmasını önemli ölçüde iyileştirir.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

Hem YOLOv6.0 hem de YOLOv8 nesne algılama tarihinin en önemli noktalarını temsil eder. YOLOv6. YOLOv6, yüksek verimli endüstriyel GPU için özel bir çözüm sunar. Ancak, kullanıcıların büyük çoğunluğu için Ultralytics YOLOv8 (ve daha yeni olan YOLO26) çok yönlülüğü, kullanım kolaylığı ve kapsamlı görev desteği ile üstün bir deneyim sunar. Tek bir çerçeve içinde algılama, segmentasyon ve poz tahmini arasında sorunsuz bir şekilde geçiş yapma yeteneği, geliştirme maliyetlerini önemli ölçüde azaltır ve değer elde etme süresini hızlandırır.

Diğer mimarilerle ilgilenen geliştiriciler ayrıca şunları da inceleyebilirler YOLOv9 programlanabilir gradyan bilgileri veya YOLO açık sözlük algılama yetenekleri için inceleyebilirler.

Detaylar

YOLOv6-3.0

Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv:2301.05586
GitHub:YOLOv6

YOLOv8

Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2023-01-10
Belgeler:YOLOv8 Belgeleri
GitHub:Ultralytics