İçeriğe geç

YOLO11 - YOLOv7 karşılaştırması: Ayrıntılı Teknik Karşılaştırma

Doğru nesne algılama modelini seçmek, bilgisayar görüşü uygulamalarının hızını, doğruluğunu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu kılavuz, YOLO (You Only Look Once) soyundaki iki önemli kilometre taşı olan Ultralytics YOLO11 ve YOLOv7 arasında derinlemesine teknik bir karşılaştırma sunar. YOLOv7 2022'de büyük bir sıçramayı temsil ederken, yakında piyasaya sürülen YOLO11, modern yapay zeka geliştirmesi için son teknoloji performansını yeniden tanımlayan mimari iyileştirmeler sunuyor.

Ultralytics YOLO11: Görüntüleme Yapay Zekası için Yeni Standart

2024'ün sonlarında piyasaya sürülen Ultralytics YOLO11, benzersiz verimlilik ve çok yönlülük sunmak için öncekilerin sağlam temeli üzerine inşa edilmiştir. Tek, birleşik bir çerçeve içinde çok çeşitli bilgisayar görüşü görevini yerine getirmek üzere tasarlanmıştır.

Mimari ve Yenilikler

YOLO11, C3k2 bloğu ve C2PSA (Cross-Stage Partial with Spatial Attention) mekanizmalarına sahip geliştirilmiş bir mimari sunar. Bu geliştirmeler, modelin önceki nesillere kıyasla daha düşük parametre sayısı korurken daha ayrıntılı özellikler çıkarmasına olanak tanır. Mimari, hız için optimize edilmiştir ve daha büyük model varyantlarının bile standart donanımda gerçek zamanlı çıkarım yeteneklerini korumasını sağlar.

YOLO11'in tanımlayıcı bir özelliği, nesne tespitinin ötesinde, örnek segmentasyonu, poz tahmini, yönlendirilmiş sınırlayıcı kutu (OBB) tespiti ve görüntü sınıflandırması dahil olmak üzere birden fazla görevi yerel olarak desteklemesidir.

Ultralytics Ekosistem Entegrasyonu

YOLO11, veri yönetimi, model eğitimi ve dağıtımı için araçlara sorunsuz erişim sağlayan Ultralytics ekosistemine tamamen entegre edilmiştir. Bu entegrasyon, MLOps ardışık düzenlerinin karmaşıklığını önemli ölçüde azaltarak ekiplerin prototipten üretime daha hızlı geçmelerini sağlar.

YOLO11 hakkında daha fazla bilgi edinin

YOLOv7: Verimli Eğitimde Bir Kriter

2022'nin ortalarında piyasaya sürülen YOLOv7, çıkarım maliyetlerini artırmadan yüksek doğruluk elde etmek için eğitim sürecini optimize etmeye büyük önem verdi. Alanındaki sonraki araştırmaları etkileyen çeşitli yeni kavramlar ortaya koydu.

Mimari ve Yenilikler

YOLOv7'nin özü, orijinal gradyan yolunu bozmadan modelin öğrenme yeteneğini geliştiren E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı)'dır. Yazarlar ayrıca, eğitim sırasında doğruluğu artıran ancak çıkarım sırasında basitleştirilen modelin yeniden parametrelendirilmesi ve yardımcı detect başlıkları gibi bir dizi optimizasyon stratejisi olan "eğitilebilir ücretsiz avantajlar çantası"nı tanıttılar.

YOLOv7, piyasaya sürüldüğünde etkileyici kıstaslar belirlese de, öncelikle bir nesne algılama mimarisidir. Segmentasyon veya poz tahmini gibi diğer görevler için uyarlanması, genellikle daha yeni modellerin birleşik yaklaşımının aksine, kod tabanının belirli dallarını veya çatallarını gerektirir.

Eski Mimari

YOLOv7, anchor tabanlı detect yöntemlerine ve karmaşık yardımcı başlıklara dayanır. Etkili olmakla birlikte, bu mimari seçimler, modelin modern Ultralytics modellerinde bulunan aerodinamik, anchor-free tasarımlara kıyasla uç dağıtım için özelleştirilmesini ve optimize edilmesini zorlaştırabilir.

YOLOv7 hakkında daha fazla bilgi edinin

Performans Analizi: Hız, Doğruluk ve Verimlilik

Teknik metrikleri karşılaştırırken, YOLO11'in mimarisindeki gelişmeler belirginleşir. Yeni model, önemli ölçüde daha az parametre ve daha hızlı çıkarım hızlarıyla karşılaştırılabilir veya daha üstün doğruluk elde eder.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Temel Çıkarımlar

  1. Parametre Verimliliği: YOLO11, model boyutunda önemli bir azalma sağlar. Örneğin, YOLO11l, YOLOv7x'in doğruluğunu (%53.1 mAP'ye karşı %53.4) aşarken neredeyse %65 daha az parametre (25.3M'ye karşı 71.3M) kullanır. Bu azalma, modelleri sınırlı depolama ve belleğe sahip cihazlarda dağıtmak için kritik öneme sahiptir.
  2. Çıkarım Hızı: YOLO11'deki mimari optimizasyonlar doğrudan hıza dönüşür. TensorRT kullanan bir T4 GPU'da YOLO11l, YOLOv7x'ten neredeyse 2 kat daha hızlıdır. CPU tabanlı uygulamalar için, hafif YOLO11n inanılmaz hızlar (56,1 ms) sunarak, YOLOv7 varyantlarının zorlanacağı uç donanımında gerçek zamanlı algılama sağlar.
  3. Hesaplama Gereksinimleri: FLOPs (Kayan Nokta İşlemleri) sayısı, YOLO11 modelleri için önemli ölçüde daha düşüktür. Bu daha düşük hesaplama yükü, daha az güç tüketimi ve ısı üretimiyle sonuçlanır ve YOLO11'i pille çalışan uç AI cihazları için oldukça uygun hale getirir.

Ekosistem ve Geliştirici Deneyimi

Ham metriklerin ötesinde, geliştirici deneyimi büyük bir fark yaratıcıdır. Ultralytics YOLO modelleri, kullanım kolaylığı ve sağlam ekosistemleriyle ünlüdür.

Kolaylaştırılmış İş Akışı

YOLOv7 genellikle bir depoyu klonlamayı ve eğitim ve test için karmaşık kabuk komut dosyalarıyla etkileşim kurmayı gerektirir. Buna karşılık, YOLO11 standart bir Python paketi aracılığıyla dağıtılır (ultralytics). Bu, geliştiricilerin sadece birkaç satır kodla gelişmiş bilgisayar görüsü yeteneklerini yazılımlarına entegre etmelerini sağlar.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train the model with a single command
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Çok Yönlülük ve Eğitim Verimliliği

YOLO11, kullanıma hazır çok çeşitli görevleri destekler. Bir proje gereksinimi basit sınırlayıcı kutulardan şuna kayarsa: örnek segmentasyonu veya poz tahmini, geliştiriciler model ağırlık dosyasını basitçe değiştirebilir (örneğin, yolo11n-seg.pt) tüm kod tabanını veya ardışık düzeni değiştirmeden. YOLOv7 genellikle bu görevler için belirli çatalları bulmayı ve yapılandırmayı gerektirir.

Ayrıca, YOLO11 eğitim verimliliğinden faydalanır. Modeller modern optimizasyon tekniklerini kullanır ve genellikle eski mimarilerden daha hızlı yakınsayan yüksek kaliteli önceden eğitilmiş ağırlıklarla birlikte gelir. Bu verimlilik bellek gereksinimlerine kadar uzanır; Ultralytics modelleri, eğitim sırasında CUDA bellek kullanımını en aza indirecek şekilde optimize edilmiştir ve eski veya Transformer tabanlı dedektörlere musallat olan yaygın Bellek Dışı (OOM) hatalarını önler.

Belgeler ve Destek

Ultralytics kapsamlı belgelendirme ve canlı bir topluluk sürdürmektedir. Kullanıcılar sık güncellemelerden, hata düzeltmelerinden ve kurumsal destek için net bir yoldan yararlanır. Aksine, YOLOv7 deposu, tarihsel olarak önemli olmakla birlikte, daha az aktif olarak sürdürülmektedir, bu da uzun vadeli üretim dağıtımları için risk oluşturabilir.

Gerçek Dünya Uygulamaları

  • Perakende Analitiği: YOLO11'in yüksek doğruluğu ve hızı, standart mağaza donanımında gerçek zamanlı müşteri davranış takibi ve envanter izlemeye olanak tanır.
  • Otonom Robotik: YOLO11n'nin düşük gecikme süresi, her milisaniyenin önemli olduğu dronlar ve robotlarda navigasyon ve engellerden kaçınma için idealdir.
  • Healthcare Imagery: Segmentasyon için yerel destek sayesinde, YOLO11, tıbbi taramalardaki anormallikleri yüksek hassasiyetle tanımlamak ve ana hatlarını çizmek için hızla uyarlanabilir.
  • Endüstriyel Denetim: OBB (Yönlendirilmiş Sınırlayıcı Kutular) işleme yeteneği, YOLO11'i standart YOLOv7'de yerel olarak bulunmayan bir özellik olan montaj hatlarındaki döndürülmüş parçaları veya metinleri algılamak için üstün kılar.

Sonuç

YOLOv7 yetenekli bir model olmaya devam etse ve 2022'de bilgisayar görüşünün hızlı ilerlemesinin bir kanıtı olsa da, Ultralytics YOLO11 modern yapay zeka geliştirme için kesin seçimi temsil ediyor. Performans, verimlilik ve kullanılabilirlik açısından üstün bir denge sunar.

Geliştiriciler ve araştırmacılar için YOLO11'e geçiş, anında faydalar sağlar: daha hızlı çıkarım süreleri, azaltılmış donanım maliyetleri ve çeşitli vizyon görevleri için birleşik bir iş akışı. Aktif Ultralytics ekosistemi tarafından desteklenen YOLO11, sadece bir model değil, gerçek dünyada son teknoloji bilgisayarlı görü dağıtmak için kapsamlı bir çözümdür.

Daha Fazla Keşif

Belirli ihtiyaçlarınız için en iyi modeli bulmak için daha fazla karşılaştırma keşfedin:


Yorumlar