İçeriğe geç

YOLO11 vs. YOLOv7: Detaylı Teknik Karşılaştırma

Doğru nesne algılama modelini seçmek, bilgisayarla görme uygulamalarının hızını, doğruluğunu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu kılavuz, aşağıdakiler arasında derinlemesine bir teknik karşılaştırma sağlar Ultralytics YOLO11 ve YOLOv7YOLO (You Only Look Once) serisinde iki önemli kilometre taşı. YOLOv7 , 2022'de ileriye doğru büyük bir sıçramayı temsil ederken, yakın zamanda piyasaya sürülen YOLO11 , modern yapay zeka geliştirme için son teknoloji performansı yeniden tanımlayan mimari iyileştirmeler sunuyor.

Ultralytics YOLO11: Görsel Yapay Zeka için Yeni Standart

2024'ün sonlarında yayınlanacak, Ultralytics YOLO11 eşsiz verimlilik ve çok yönlülük sunmak için öncüllerinin sağlam temelleri üzerine inşa edilmiştir. Tek ve birleşik bir çerçeve içinde çok çeşitli bilgisayarla görme görevlerini yerine getirmek üzere tasarlanmıştır.

Mimari ve Yenilikler

YOLO11 , C3k2 bloğu ve C2PSA (Uzamsal Dikkat ile Aşamalar Arası Kısmi) mekanizmalarını içeren rafine bir mimari sunar. Bu geliştirmeler, modelin önceki nesillere kıyasla daha düşük parametre sayısını korurken daha fazla ayrıntıya sahip özellikler çıkarmasına olanak tanır. Mimari, hız için optimize edilmiştir ve daha büyük model varyantlarının bile standart donanım üzerinde gerçek zamanlı çıkarım yeteneklerini korumasını sağlar.

YOLO11 'in tanımlayıcı bir özelliği, örnek segmentasyonu, poz tahmini, yönlendirilmiş sınırlayıcı kutu (OBB) tespiti ve görüntü sınıflandırması dahil olmak üzere nesne tespitinin ötesinde birden fazla görev için yerel desteğidir.

Ultralytics Ekosistem Entegrasyonu

YOLO11 , Ultralytics ekosistemine tamamen entegre edilmiştir ve geliştiricilere veri yönetimi, model eğitimi ve dağıtımı için araçlara sorunsuz erişim sağlar. Bu entegrasyon, MLOps işlem hatlarının karmaşıklığını önemli ölçüde azaltarak ekiplerin prototipten üretime daha hızlı geçmesini sağlar.

YOLO11 hakkında daha fazla bilgi edinin

YOLOv7: Verimli Eğitimde Bir Ölçüt

2022 yılının ortalarında yayınlanan YOLOv7, çıkarım maliyetlerini artırmadan yüksek doğruluk elde etmek için eğitim sürecini optimize etmeye odaklanmıştır. Alandaki sonraki araştırmaları etkileyen birkaç yeni kavram ortaya koymuştur.

Mimari ve Yenilikler

YOLOv7 'nin çekirdeği, orijinal gradyan yolunu yok etmeden modelin öğrenme kabiliyetini geliştiren E-ELAN 'dır (Genişletilmiş Verimli Katman Toplama Ağı). Yazarlar ayrıca, eğitim sırasında doğruluğu artıran ancak çıkarım sırasında ortadan kaldırılan model yeniden parametrelendirme ve yardımcı algılama başlıklarıgibi bir optimizasyon stratejileri koleksiyonu olan "eğitilebilir ücretsiz çanta" yı tanıttı.

YOLOv7 piyasaya çıktığında etkileyici ölçütler belirlemiş olsa da, öncelikle bir nesne algılama mimarisidir. Segmentasyon veya poz tahmini gibi diğer görevler için uyarlanması, yeni modellerin birleşik yaklaşımının aksine, genellikle kod tabanının belirli dallarını veya çatallarını gerektirir.

Eski Mimari

YOLOv7 , çapa tabanlı tespit yöntemlerine ve karmaşık yardımcı başlıklara dayanır. Etkili olmakla birlikte, bu mimari seçimler, modern Ultralytics modellerinde bulunan aerodinamik, çapasız tasarımlara kıyasla modelin özelleştirilmesini ve uç dağıtım için optimize edilmesini daha zor hale getirebilir.

YOLOv7 hakkında daha fazla bilgi edinin

Performans Analizi: Hız, Doğruluk ve Verimlilik

Teknik ölçütler karşılaştırıldığında, YOLO11'in mimarisindeki ilerlemeler açıkça ortaya çıkmaktadır. Yeni model, önemli ölçüde daha az parametre ve daha yüksek çıkarım hızları ile karşılaştırılabilir veya daha üstün doğruluk elde etmektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Temel Çıkarımlar

  1. Parametre Verimliliği: YOLO11 model boyutunda ciddi bir azalma sağlar. Örneğin, YOLO11l yaklaşık %65 daha az parametre (25,3M'ye karşı 71,3M) kullanırken YOLOv7x 'in doğruluğunu aşar (%53,4'e karşı %53,1 mAP). Bu azalma, modellerin sınırlı depolama ve belleğe sahip cihazlara dağıtılması için kritik öneme sahiptir.
  2. Çıkarım Hızı: YOLO11 'deki mimari optimizasyonlar doğrudan hıza dönüşür. T4 GPU üzerinde TensorRTYOLO11l, YOLOv7x'ten neredeyse 2 kat daha hızlıdır. CPU uygulamalar için, hafif YOLO11n inanılmaz hızlar (56,1 ms) sunarak YOLOv7 varyantlarının zorlanacağı uç donanımlarda gerçek zamanlı algılama sağlar.
  3. Hesaplama Gereksinimleri: FLOP (Kayan Nokta İşlemleri) sayısı YOLO11 modelleri için önemli ölçüde daha düşüktür. Bu daha düşük hesaplama yükü, daha az güç tüketimi ve ısı üretimi ile sonuçlanır ve YOLO11 'i pille çalışan uç yapay zeka cihazları için son derece uygun hale getirir.

Ekosistem ve Geliştirici Deneyimi

Ham metriklerin ötesinde, geliştirici deneyimi önemli bir farklılaştırıcıdır. Ultralytics YOLO modelleri, kullanım kolaylığı ve sağlam ekosistemi ile ünlüdür.

Kolaylaştırılmış İş Akışı

YOLOv7 tipik olarak bir depoyu klonlamayı ve eğitim ve test için karmaşık kabuk komut dosyalarıyla etkileşime girmeyi gerektirir. Buna karşılık, YOLO11 standart bir Python paketi (ultralytics). Bu, geliştiricilerin gelişmiş bilgisayarla görme yeteneklerini sadece birkaç satır kodla yazılımlarına entegre etmelerine olanak tanır.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train the model with a single command
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Çok Yönlülük ve Eğitim Verimliliği

YOLO11 çok çeşitli görevleri kullanıma hazır olarak destekler. Eğer bir proje gereksinimi basit sınırlayıcı kutulardan örnek segmentasyonu veya poz tahminigeliştiriciler basitçe model ağırlık dosyasını değiştirebilirler (örn, yolo11n-seg.pt) tüm kod tabanını veya boru hattını değiştirmeden. YOLOv7 genellikle bu görevler için belirli çatalların bulunmasını ve yapılandırılmasını gerektirir.

Ayrıca, YOLO11 eğitim verimliliğinden de faydalanmaktadır. Modeller modern optimizasyon tekniklerini kullanır ve genellikle eski mimarilerden daha hızlı yakınsayan yüksek kaliteli önceden eğitilmiş ağırlıklarla birlikte gelir. Bu verimlilik bellek gereksinimlerine kadar uzanır; Ultralytics modelleri, eğitim sırasında CUDA bellek kullanımını en aza indirecek şekilde optimize edilmiştir ve eski veya Transformer tabanlı dedektörleri rahatsız eden yaygın Bellek Dışı (OOM) hatalarını önler.

Dokümantasyon ve Destek

Ultralytics kapsamlı dokümantasyon ve canlı bir topluluğa sahiptir. Kullanıcılar sık güncellemelerden, hata düzeltmelerinden ve kurumsal destek için açık bir yoldan yararlanır. Buna karşılık, YOLOv7 deposu, tarihsel olarak önemli olmakla birlikte, daha az aktif olarak sürdürülmektedir ve bu da uzun vadeli üretim dağıtımları için risk oluşturabilir.

Gerçek Dünya Uygulamaları

  • Perakende Analitiği: YOLO11 'in yüksek doğruluğu ve hızı, standart mağaza donanımında gerçek zamanlı müşteri davranışı takibi ve envanter izlemeye olanak tanır.
  • Otonom Robotik: YOLO11n'in düşük gecikme süresi, her milisaniyenin önemli olduğu drone ve robotlarda navigasyon ve engellerden kaçınma için idealdir.
  • Sağlık Hizmetleri Görüntüleri: Segmentasyon için yerel destek ile YOLO11 , tıbbi taramalardaki anormallikleri yüksek hassasiyetle tanımlamak ve ana hatlarını belirlemek için hızlı bir şekilde uyarlanabilir.
  • Endüstriyel Denetim: OBB (Yönlendirilmiş Sınırlayıcı Kutular) işleme yeteneği, YOLO11 'i montaj hatlarındaki döndürülmüş parçaları veya metinleri tespit etmek için üstün kılar; bu özellik standart YOLOv7'de yerel olarak mevcut değildir.

Sonuç

YOLOv7 yetenekli bir model ve 2022'de bilgisayarla görmenin hızlı ilerlemesinin bir kanıtı olmaya devam ediyor, Ultralytics YOLO11 modern yapay zeka geliştirme için kesin seçimi temsil eder. Üstün bir performans, verimlilik ve kullanılabilirlik dengesi sunar.

Geliştiriciler ve araştırmacılar için YOLO11 'e geçiş anında avantajlar sağlar: daha hızlı çıkarım süreleri, daha düşük donanım maliyetleri ve çeşitli görme görevleri için birleşik bir iş akışı. Aktif Ultralytics ekosistemi tarafından desteklenen YOLO11 , sadece bir model değil, gerçek dünyada son teknoloji bilgisayarla görmeyi uygulamak için kapsamlı bir çözümdür.

Daha Fazla Keşif

Özel ihtiyaçlarınıza en uygun modeli bulmak için daha fazla karşılaştırma keşfedin:


Yorumlar