İçeriğe geç

PP-YOLOE+ vs. YOLOv7: Nesne Algılama Mimarilerine Teknik Bir Derin Dalış

En uygun nesne algılama modelinin seçilmesi doğruluk, çıkarım hızı ve dağıtım karmaşıklığının dengelenmesini gerektirir. Bu alandaki iki önemli rakip PP-YOLOE+ ve YOLOv7Her ikisi de 2022 yılında son teknoloji performansını ilerletmek amacıyla piyasaya sürüldü. Bu kapsamlı analiz, geliştiricilerin veriye dayalı kararlar vermelerine yardımcı olmak için benzersiz mimarilerini, kıyaslamalarını ve gerçek dünya uygulamaları için uygunluklarını araştırıyor.

Performans Metriklerinin Karşılaştırılması

Aşağıdaki tablo, Ortalama Ortalama Hassasiyet (mAP) ve desteklenen donanım üzerindeki çıkarım hızları dahil olmak üzere temel performans ölçümlerinin doğrudan bir karşılaştırmasını sunmaktadır. Bu veriler, PP-YOLOE+'nın çapasız yaklaşımı ile YOLOv7'nin optimize edilmiş mimarisi arasındaki değiş tokuşları görselleştirmeye yardımcı olur.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

PP-YOLOE+: Rafine Çapasız Algılama

PP-YOLOE+, Baidu'daki araştırmacılar tarafından geliştirilen YOLO serisinin bir evrimidir. Yakınsama hızını ve aşağı akış görev performansını daha da iyileştirmek için eğitim sürecine ve mimarisine geliştirmeler getirerek selefi PP-YOLOE'nin güçlü yönlerini temel alır. Çapasız bir dedektör olarak, önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırarak tasarımı basitleştirir ve hiperparametre ayarını azaltır.

PP-YOLOE+ hakkında daha fazla bilgi edinin

Mimari Öne Çıkanlar

PP-YOLOE+ mimarisinde bir CSPResNet bulunmaktadır backbone birden fazla ölçekteki özellikleri etkili bir şekilde yakalamak için değişen alıcı alanlarla donatılmıştır. Önemli bir yenilik, sınıflandırma ve regresyon görevlerini birbirinden ayırırken belirli bir kayıp fonksiyonu aracılığıyla hizalanmalarını sağlayan Verimli Görev Hizalamalı Kafa'dır (ET-head).

PP-YOLOE+, sınıflandırma ve yerelleştirme kalitesinin hizalanmasına dayalı olarak pozitif örnekleri dinamik olarak seçen bir etiket atama stratejisi olan Görev Hizalama Öğrenimini (TAL) kullanır. Bu, modelin eğitim sırasında yüksek kaliteli tahminlere odaklanmasını sağlar. Ayrıca, model dağıtılmış bir eğitim stratejisi kullanır ve standart olmayan operatörlerin kullanımından kaçınarak PaddlePaddle ekosistemi tarafından desteklenen çeşitli donanım platformlarında daha kolay dağıtımı kolaylaştırır.

Anahtar Özellik: Ankrajsız Tasarım

PP-YOLOE+, bağlantı kutularını kaldırarak bağlantı kümeleme ve eşleştirme adımlarıyla ilişkili karmaşıklığı azaltır. Bu genellikle nesnelerin aşırı en boy oranlarına sahip olabileceği çeşitli veri kümelerinde daha iyi genelleme sağlar.

YOLOv7: Gerçek Zamanlı Hız için Optimize Edildi

YOLOv7 piyasaya sürüldüğünde gerçek zamanlı nesne algılama için yeni bir ölçüt belirledi ve büyük ölçüde mimari verimliliğe ve çıkarım maliyetini artırmadan doğruluğu artıran teknikler olan "serbest çanta" yöntemlerine odaklandı. Hem hız hem de doğruluk açısından YOLOR ve YOLOv5 gibi önceki son teknoloji modellerden daha iyi performans gösterecek şekilde tasarlanmıştır.

YOLOv7 hakkında daha fazla bilgi edinin

Mimari Yenilikler

YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağını (E-ELAN) tanıttı. Bu backbone tasarımı, en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlar ve orijinal gradyan yolunu yok etmeden öğrenme yeteneğini geliştirir.

Bir diğer önemli katkı ise Model Yeniden Parametrelendirmenin kullanılmasıdır. Eğitim sırasında model, çıkarım için daha basit tek dallı bir yapıda birleştirilen çok dallı bir yapı kullanır. Bu, YOLOv7 'nin öğrenme sırasında zengin özellik temsillerinden yararlanmasına ve dağıtım sırasında yüksek hızı korumasına olanak tanır. Model ayrıca derin ağları eğitmek için "kabadan inceye" kılavuzlu etiket atama stratejisi kullanan yardımcı başlıklar kullanmaktadır.

Karşılaştırmalı Analiz: Güçlü ve Zayıf Yönler

Bu iki güçlü model arasında karar verirken, bilgisayarla görme projenizin özel gereksinimlerini göz önünde bulundurmanız çok önemlidir.

Doğruluk ve Hız

PP-YOLOE+ granüler bir model yelpazesi sunar. Bu PP-YOLOE+s uç cihazlar için oldukça verimliyken PP-YOLOE+x daha düşük kare hızlarında da olsa üst düzey mAP elde eder. YOLOv7 , gerçek zamanlı algılamanın "tatlı noktasında" üstünlük sağlar ve birçok rakibe kıyasla belirli bir doğruluk seviyesi için GPU donanımında genellikle daha yüksek FPS sunar. Aşağıdaki gibi yüksek verimli uygulamalar için trafik izlemeYOLOv7'nin çıkarım optimizasyonu avantajlıdır.

Ekosistem ve Kullanılabilirlik

Temel farklılıklardan biri ekosistemlerinde yatmaktadır. PP-YOLOE+, PaddlePaddle çerçevesine derinden bağlıdır. Güçlü olsa da, bu öncelikle PyTorch'a alışkın ekipler için daha dik bir öğrenme eğrisi sunabilir. YOLOv7 PyTorch'a özgüdür, bu da onu daha geniş araştırma topluluğu için genellikle daha erişilebilir hale getirir.

Bununla birlikte, her iki modelin de eğitilmesi ve ince ayarlarının yapılması modern standartlara kıyasla karmaşık olabilir. YOLOv7 karmaşık çapa hesaplamaları ve hiperparametre hassasiyeti içerirken, PP-YOLOE+ Kürek algılama konfigürasyonlarında gezinmeyi gerektirir.

Ultralytics Avantajı: Neden Yükseltme?

PP-YOLOE+ ve YOLOv7 mükemmel modeller olsa da, yapay zeka alanı hızla ilerlemektedir. Ultralytics modelleri, örneğin YOLOv8 ve son teknoloji ürünü YOLO11daha önceki mimarilerde bulunan kullanılabilirlik ve verimlilik zorluklarının çoğunu ele alan yeni nesil görsel yapay zekayı temsil etmektedir.

Üstün Kullanıcı Deneyimi ve Ekosistem

Ultralytics kullanım kolaylığına öncelik verir. Diğer çerçevelerin sıklıkla gerektirdiği karmaşık yapılandırma dosyalarının aksine, Ultralytics modelleri sadece birkaç satır Python kodu veya basit CLI komutları ile eğitilebilir, doğrulanabilir ve dağıtılabilir.

  • Birleşik API: Nesne algılama, örnek segmentasyonu, sınıflandırma, poz tahmini ve OBB gibi görevler arasında sorunsuzca geçiş yapın.
  • Bakımlı Ekosistem: Sık güncellemelerden, gelişen bir topluluktan ve sorunların hızla çözülmesine yardımcı olan kapsamlı belgelerden yararlanın.
  • Entegrasyon: Deney izleme (MLflow, Comet), veri kümesi yönetimi ve ONNX, TensorRT ve CoreML gibi formatlara basitleştirilmiş model aktarımı için yerel destek.

Performans ve Verimlilik

Ultralytics modelleri optimum performans dengesi için tasarlanmıştır. Genellikle daha düşük hesaplama yükü ile YOLOv7 'den daha yüksek doğruluk elde ederler. Ayrıca, bellek açısından verimli olacak şekilde tasarlanmışlardır ve daha az CUDA Birçok transformatör tabanlı alternatife veya eski YOLO sürümlerine kıyasla eğitim sırasında bellek. Bu eğitim verimliliği, daha hızlı iterasyonlara ve daha düşük bulut bilişim maliyetlerine olanak tanır.

Kod Örneği: Uygulamada Basitlik

Eski iş akışlarına kıyasla modern bir Ultralytics modelini eğitmenin ne kadar kolay olduğunu görün:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model (recommended for best performance)
model = YOLO("yolo11n.pt")

# Train the model on a dataset (e.g., COCO8)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

Projelerinizi Geleceğe Hazırlama

Ultralytics çerçevesini benimsemek, yalnızca bir model değil, gelişen bir platform kullanmanızı sağlar. En son sürüm desteği ile Python sürümleri ve donanım hızlandırıcıları sayesinde teknik borcu azaltır ve yapay zeka çözümleriniz için uzun vadeli sürdürülebilirlik sağlarsınız.

Sonuç

PP-YOLOE+, PaddlePaddle ekosistemine yatırım yapanlar için güçlü bir seçim olmaya devam ediyor ve sağlam bir ankrajsız mimari sunuyor. YOLOv7 , ham GPU verimi gerektiren projeler için zorlu bir seçenek olmaya devam ediyor. Ancak, bilgisayarla görme görevlerinin tamamını kapsayan çok yönlü, kullanıcı dostu ve yüksek performanslı bir çözüm arayan geliştiriciler için, Ultralytics YOLO11 ileriye doğru önerilen yoldur.

Diğer Modelleri İnceleyin

Bu karşılaştırmalarla nesne algılama ortamına ilişkin anlayışınızı genişletin:


Yorumlar