İçeriğe geç

YOLO11 vs. YOLOv6.0: Son Teknoloji Nesne Algılama Karşılaştırması

Optimum bilgisayarla görme modelinin seçilmesi, yapay zeka uygulamalarının verimliliğini, doğruluğunu ve ölçeklenebilirliğini etkileyen çok önemli bir karardır. Bu kılavuz, aşağıdakileri karşılaştıran kapsamlı bir teknik analiz sunar Ultralytics YOLO11 ve YOLOv6.0. Mimari yeniliklerini, performans kıyaslamalarını, eğitim metodolojilerini ve çeşitli gerçek dünya dağıtım senaryolarına uygunluklarını inceliyoruz. Her iki çerçeve de alana önemli katkılarda bulunmuş olsa da, YOLO11 verimlilik, çok yönlülük ve kullanıcı deneyimi açısından en son evrimi temsil etmektedir.

Ultralytics YOLO11

Yazarlar: Glenn Jocher ve Jing Qiu
Organizasyon: Ultralytics
Tarih: 2024-09-27
GitHub: ultralytics
Dokümanlar: https:yolo11

YOLO11 , Ultralytics tarafından 2024 yılının sonlarında piyasaya sürülen YOLO (You Only Look Once) serisinin en son evrimidir. gibi öncüllerin başarısı üzerine inşa edilmiştir. YOLOv8hesaplama maliyetlerini en aza indirirken performansı en üst düzeye çıkarmak için tasarlanmış rafine bir mimari sunar. YOLO11 , otomotivden sağlık hizmetlerine kadar çeşitli sektörler için çok yönlü bir çözüm olarak konumlandırılan çok çeşitli bilgisayarla görme görevlerini yerine getirmek üzere tasarlanmıştır.

Mimari ve Temel Özellikler

YOLO11 'in mimarisi, özellik çıkarma ve işleme verimliliğini artırmaya odaklanmaktadır. Geliştirilmiş bir backbone ve gereksiz hesaplamaları azaltan boyun tasarımı, hem uç cihazlarda hem de bulut sunucularında daha yüksek çıkarım hızlarına olanak tanır. Çapasız bir dedektör olan YOLO11 , manuel çapa kutusu yapılandırması ihtiyacını ortadan kaldırarak eğitim hattını basitleştirir ve çeşitli nesne şekillerine uyarlanabilirliği artırır.

Güçlü Yönler

  • Eşsiz Performans Dengesi: YOLO11 , karşılaştırılabilir modellere göre önemli ölçüde daha az parametre ve FLOP ile daha yüksek Ortalama Ortalama Hassasiyet (mAP) sunar. Bu verimlilik, depolama gereksinimlerini azaltır ve işlem sürelerini hızlandırır.
  • Kapsamlı Çok Yönlülük: Sınırlayıcı kutularla sınırlı birçok dedektörün aksine, YOLO11 nesne algılama, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB ) tek bir çerçeve içinde yerel olarak destekler.
  • Kolaylaştırılmış Ekosistem: Kullanıcılar, kullanıcı dostu bir Python API'si, kodsuz eğitim için Ultralytics HUB ile sorunsuz entegrasyon ve kapsamlı topluluk desteği içeren sağlam Ultralytics ekosisteminden yararlanır.
  • Eğitim Verimliliği: Model, eğitim sırasında daha hızlı yakınsama ve daha düşük bellek kullanımı için optimize edilmiştir. Bu, genellikle önemli miktarda enerji tüketimi gerektiren transformatör tabanlı mimarilere göre belirgin bir avantajdır. GPU Hafıza.

Zayıflıklar

  • Benimseme Eğrisi: Yakın zamanda piyasaya sürülen bir model olarak, üçüncü taraf eğitimlerin ve harici kaynakların hacmi hızla artmaktadır, ancak şu anda eski, eski sürümlerden daha az olabilir. YOLOv5.
  • Küçük Nesne Zorlukları: Önemli ölçüde iyileştirilmiş olsa da, son derece küçük nesnelerin tespiti, daha yavaş da olsa özel yaklaşımlara kıyasla tek aşamalı nesne dedektörleri için zorlu bir görev olmaya devam etmektedir.

İdeal Kullanım Senaryoları

YOLO11 , yüksek verim ve hassasiyet gerektiren senaryolarda mükemmeldir:

  • Otonom Sistemler: Kendi kendine giden arabalar ve insansız hava araçları için gerçek zamanlı nesne takibi.
  • Akıllı Üretim: Eşzamanlı hata tespiti ve segmentasyon gerektiren kalite güvence görevleri.
  • Sağlık hizmetleri: Kaynak kısıtlı konuşlandırmanın sıklıkla gerekli olduğu tıbbi görüntüleme analizi.
  • Perakende Analitiği: Poz tahmini ve takibi kullanarak müşteri davranış analizi ve envanter yönetimi.

YOLO11 hakkında daha fazla bilgi edinin

YOLOv6.0

Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Dokümanlar: https:ultralytics

YOLOv6.0, Meituan tarafından geliştirilen ve özellikle endüstriyel uygulamaları hedefleyen bir nesne algılama çerçevesidir. 2023'ün başlarında piyasaya sürülen bu çerçeve, lojistik ve otomasyondaki gerçek zamanlı sistemlerin ihtiyaçlarını karşılayarak çıkarım hızı ve doğruluğu arasında rekabetçi bir denge sunmak üzere tasarlanmıştır.

Mimari ve Temel Özellikler

YOLOv6.0 mimarisi, ağın "Tam Ölçekli Yeniden Yüklenmesini" sağlar. Verimli bir yeniden parametrelendirilebilir backbone (EfficientRep) ve bir ayrıştırıcı kafa yapısı kullanır. Temel yenilikler arasında, çıkarım maliyetlerini artırmadan doğruluğu artırmak için eğitim sırasında kendi kendine damıtma tekniklerinin kullanılması ve aşağıdakiler için özel optimizasyonlar bulunmaktadır TensorRT Dağıtım.

Güçlü Yönler

  • Endüstriyel Odak: Model mimarisi, özellikle NVIDIA GPU'lardaki gecikme süresini optimize ederek endüstriyel donanım için uyarlanmıştır.
  • Niceleme Hazırlığı: YOLOv6 , model niceleme için özel destek sağlayarak sınırlı hesaplama hassasiyetine sahip donanımlarda dağıtımı kolaylaştırır.
  • Mobil Varyantlar: Çerçeve, mobil CPUS ve DSP mimarileri için optimize edilmiş YOLOv6 sürümlerini içerir.

Zayıflıklar

  • Kaynak Yoğunluğu: Performans verilerinde gösterildiği gibi, YOLOv6.0, YOLO11 gibi daha yeni modellerle karşılaştırılabilir doğruluk elde etmek için genellikle önemli ölçüde daha fazla parametre ve FLOP gerektirir.
  • Sınırlı Görev Kapsamı: Birincil odak noktası nesne algılamadır. Birleşik Ultralytics çerçevesinde bulunan kesintisiz, yerel çoklu görev desteğinden (segmentasyon, poz, sınıflandırma, OBB) yoksundur.
  • Ekosistem Parçalanması: Açık kaynaklı olmasına rağmen, ekosistem Ultralytics'e göre daha az entegredir ve veri kümesi yönetimi, izleme ve bulut eğitimi gibi görevler için potansiyel olarak daha fazla manuel çaba gerektirir.

İdeal Kullanım Senaryoları

YOLOv6.0 aşağıdakiler için uygundur:

  • Eski Endüstriyel Sistemler: YOLOv6 mimarisi için özel olarak ayarlanmış ortamlar.
  • Özel Algılama Görevleri: Yalnızca sınırlayıcı kutu tespitinin gerekli olduğu ve çoklu görev özelliklerinin gereksiz olduğu uygulamalar.
  • Belirli Donanım Dağıtımları: Meituan çerçevesi tarafından desteklenen belirli niceleme işlem hatlarından yararlanan senaryolar.

YOLOv6 hakkında daha fazla bilgi edinin

Performans Ölçütleri: Hız, Doğruluk ve Verimlilik

Aşağıdaki tabloda COCO veri kümesi üzerinde YOLO11 ve YOLOv6.0'ın ayrıntılı bir karşılaştırması sunulmaktadır. Metrikler, YOLO11 mimarisi tarafından elde edilen verimlilikteki gelişmeleri vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7

Veri Analizi

Karşılaştırma net bir eğilim ortaya koymaktadır: YOLO11 , önemli ölçüde azaltılmış hesaplama ek yükü ile sürekli olarak daha yüksek doğruluk (mAP) elde etmektedir.

  • Parametre Verimliliği: YOLO11m modeli, YOLOv6.0m'nin 50.0 mAP 'sine kıyasla üstün bir 51.5 mAP elde eder, ancak 34.9M'ye karşı sadece 20.1M parametre kullanır. Bu, daha iyi performans için model boyutunda yaklaşık %42'lik bir azalmayı temsil etmektedir.
  • Hesaplama Maliyeti: Benzer şekilde, YOLO11l 53,4 mAP'ye ulaşmak için 86,9B FLOP gerektirirken, YOLOv6.0l daha düşük 52,8 mAP için 150,7B FLOP gerektirmektedir. Daha düşük FLOP'lar, gömülü sistemler için kritik faktörler olan daha düşük güç tüketimi ve daha az ısı üretimi anlamına gelir.
  • Çıkarım Hızı: YOLOv6.0n biraz daha hızlı TensorRT hızları gösterirken, önemli doğruluk farkı (2,0 mAP) ve daha büyük model boyutu, YOLO11n'i hassasiyetin çok önemli olduğu modern uygulamalar için daha dengeli bir seçim haline getirmektedir.

Dağıtım Avantajı

YOLO11 'in azaltılmış parametre sayısı yalnızca çıkarımı hızlandırmakla kalmaz, aynı zamanda bellek bant genişliği gereksinimlerini de azaltır. Bu, YOLO11 'i özellikle Raspberry Pi veya NVIDIA Jetson gibi bellek kaynaklarının genellikle darboğaz oluşturduğu uç cihazlarda etkili kılar.

Eğitim ve Kullanılabilirlik

Kullanım Kolaylığı ve Ekosistem

En önemli farklılaştırıcılardan biri, modelleri çevreleyen ekosistemdir. Ultralytics YOLO11 , tüm makine öğrenimi operasyonları (MLOps) yaşam döngüsünü basitleştiren kapsamlı bir platforma entegre edilmiştir.

  • Basit API: Geliştiriciler sadece birkaç satır Python kodu ile YOLO11 'i yükleyebilir, eğitebilir ve tahmin edebilir.
  • Dokümantasyon: Kapsamlı ve aktif olarak sürdürülen belgeler, kullanıcıların veri açıklamasından model dışa aktarımına kadar her konuda kılavuzları kolayca bulabilmelerini sağlar.
  • Topluluk: GitHub ve Discord 'daki canlı bir topluluk hızlı destek ve sürekli iyileştirmeler sağlar.

Buna karşılık, YOLOv6 sağlam bir kod tabanı sağlarken, yeni projeler için dağıtım süresini artırabilecek aynı düzeyde entegre araç ve topluluk odaklı kaynak kullanılabilirliğinden yoksundur.

Eğitim Verimliliği

YOLO11 , eğitim sırasında son derece verimli olacak şekilde tasarlanmıştır. Mimarisi daha hızlı yakınsama sağlar, yani kullanıcılar genellikle eski mimarilere kıyasla daha az epokta hedef doğruluklarına ulaşabilirler. Ayrıca, eğitim sırasındaki bellek gereksinimleri optimize edilerek tüketici sınıfı GPU'larda daha büyük parti boyutlarına izin verilir.

İşte bir YOLO11 modelini eğitmeye başlamanın ne kadar kolay olduğunu gösteren bir örnek:

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Sonuç

YOLOv6.0, belirli endüstriyel algılama görevleri için yetenekli bir model olmaya devam ederken, Ultralytics YOLO11, yeni bilgisayarla görme projelerinin büyük çoğunluğu için üstün bir seçim olarak öne çıkıyor.

YOLO11 , daha yüksek doğruluk, daha düşük kaynak tüketimi ve eşsiz çok yönlülüğün cazip bir kombinasyonunu sunar. Algılama, segmentasyon, poz tahmini ve sınıflandırmayı tek bir kullanımı kolay çerçeve içinde gerçekleştirme yeteneği, geliştirme iş akışlarını kolaylaştırır. Aktif olarak sürdürülen Ultralytics ekosistemi ve Ultralytics HUB gibi araçlarla desteklenen YOLO11 , ölçeklenebilir, yüksek performanslı yapay zeka çözümleri oluşturmak için geleceğe dönük bir temel sağlar.

Performans, verimlilik ve kullanım kolaylığı arasında en iyi dengeyi arayan geliştiriciler için YOLO11 önerilen YOLO11 .

Diğer Modelleri İnceleyin

Daha fazla karşılaştırmayla ilgileniyorsanız, belgelerdeki bu ilgili sayfaları inceleyin:


Yorumlar