Link to this sectionYOLOv7 ve YOLOv9#
Gerçek zamanlı nesne algılama dünyası hızla gelişiyor ve her yeni sürüm, hem uç cihazlarda hem de bulut sunucularında mümkün olanın sınırlarını zorluyor. Bilgisayarlı görü projeleri için mimarileri değerlendirirken, geliştiriciler genellikle yerleşik kıyaslama ölçütlerini yeni yeniliklerle karşılaştırıyor. Bu kapsamlı kılavuz, YOLO ailesindeki iki önemli dönüm noktasını karşılaştırıyor: YOLOv7 ve YOLOv9.
Uygulamanız için doğru modeli seçmenize yardımcı olmak amacıyla mimari atılımlarını, performans ölçütlerini ve ideal dağıtım senaryolarını analiz edeceğiz. Ayrıca Ultralytics Platform aracının bu modelleri nasıl bir araya getirdiğini, eğitimlerini, doğrulamalarını ve dağıtımlarını nasıl kolaylaştırdığını inceleyeceğiz.
Link to this sectionModel Soy Ağacı ve Teknik Özellikler#
Bu modellerin kökenlerini ve tasarım felsefelerini anlamak, yetenekleri için temel bir bağlam sağlar. Her iki model de ortak bir araştırma geçmişini paylaşır ancak farklı mimari darboğazları hedefler.
Link to this sectionYOLOv7: Bag-of-Freebies'in Öncüsü#
2022'nin ortalarında piyasaya sürülen YOLOv7, kendisini oldukça güvenilir ve yoğun bir şekilde optimize edilmiş bir mimari olarak kanıtladı. ortalama Hassasiyet (mAP) değerinden ödün vermeden yüksek çıkarım hızlarını korumak için yapısal yeniden parametrelendirme ve "eğitilebilir ücretsizler çantası" yaklaşımını tanıttı.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
- Tarih: 6 Temmuz 2022
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
Mimari Yenilikler: YOLOv7, modelin kardinaliteyi genişleterek, karıştırarak ve birleştirerek daha çeşitli özellikleri öğrenmesini sağlayan Genişletilmiş Verimli Katman Birleştirme Ağı (E-ELAN) özelliğine sahiptir. Bu tasarım, mükemmel GPU kullanımı ve çıkarım gecikmesi sağlar. Ancak, modern sürümlere kıyasla karmaşık eğitim çalışmaları sırasında önemli miktarda bellek gerektirebilir.
YOLOv7 hakkında daha fazla bilgi edinin
Link to this sectionYOLOv9: Bilgi Darboğazını Çözmek#
Aynı araştırma ekibi tarafından 2024'ün başlarında tanıtılan YOLOv9, derin sinir ağlarında doğuştan gelen "bilgi darboğazı" sorununu ele alıyor. Veriler derin katmanlardan geçerken, hayati ayrıntılar genellikle kaybolur. YOLOv9, bunu temelden yeni katman tasarımlarıyla hafifletir.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
- Tarih: 21 Şubat 2024
- Arxiv: 2402.13616
- GitHub: WongKinYiu/yolov9
Mimari Yenilikler: YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağını (GELAN) tanıtır. PGI, güvenilir gradyanların korunmasını ve ağırlıkları doğru bir şekilde güncellemek için geri beslenmesini sağlar. GELAN, parametre verimliliğini en üst düzeye çıkararak YOLOv9'un seleflerinden önemli ölçüde daha az FLOPs ile yüksek doğruluk elde etmesini sağlar.
YOLOv9 hakkında daha fazla bilgi edin
Link to this sectionPerformans Analizi#
Mimariler arasında seçim yaparken, yapay zeka mühendisleri doğruluk, çıkarım hızı ve hesaplama maliyeti arasında denge kurmalıdır. Aşağıdaki tablo, bu modellerin standart COCO veri kümesi üzerindeki performans farklarını vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Link to this sectionÖnemli Çıkarımlar#
- Parametre Verimliliği: YOLOv9m, neredeyse %45 daha az parametre (20,0M'ye karşı 36,9M) kullanarak YOLOv7l'nin (%51,4 mAP) doğruluğunu yakalar. Bu çarpıcı azalma, YOLOv9m'yi bellek kısıtlı uç yapay zeka cihazlarında dağıtmayı çok daha kolay hale getirir.
- Mikro Dağıtımlar: YOLOv9t (tiny) varyantının tanıtımı, gerçek zamanlı kısıtlamaların mutlak olduğu ortamlar için (T4 TensorRT üzerinde 2,3 ms) inanılmaz hızlar sağlar.
- Maksimum Doğruluk: Hassasiyetin her şeyden önemli olduğu uygulamalar için YOLOv9e, algılama doğruluğunu %55,6 mAP'ye çıkararak YOLOv7x'ten önemli ölçüde daha iyi performans gösterir.
YOLOv7 ve YOLOv9 güçlü olsa da, yeni piyasaya sürülen YOLO26 kesin bir ileri atılımı temsil ediyor. YOLO26, karmaşık işlem sonrası süreçleri ortadan kaldıran ve CPU çıkarım hızlarını %43'e kadar artıran yerel bir uçtan uca NMS'siz tasarım sunar. Yeni MuSGD optimize edici ve geliştirilmiş ProgLoss + STAL kayıp işlevlerini kullanan YOLO26, benzersiz bir eğitim kararlılığı ve küçük nesne algılama doğruluğu sağlar.
Link to this sectionUltralytics Avantajı#
Model mimarisi seçmek sadece ilk adımdır. Modelin etrafındaki yazılım ekosistemi, prototipten üretime ne kadar hızlı geçebileceğinizi belirler. Bu modelleri Ultralytics Python API aracılığıyla entegre etmek, geliştiriciler ve araştırmacılar için önemli avantajlar sağlar.
Link to this sectionKullanım Kolaylığı ve Eğitim Verimliliği#
Geçmişte, YOLOv7'yi eğitmek karmaşık veri hazırlığı ve yoğun şekilde özelleştirilmiş betikler gerektiriyordu. Ultralytics çerçevesi, bu derin öğrenme karmaşıklıklarını ortadan kaldırır. Geliştiriciler mimariler arasında kolayca geçiş yapabilir, hiperparametre ayarı ile denemeler yapabilir ve akıllı veri artırma boru hatlarını minimum kodla kullanabilir.
Ayrıca Ultralytics, eğitim ve çıkarım sırasında bellek kullanımını optimize eder. Hantal transformer modellerinin (örneğin RT-DETR) aksine, Ultralytics YOLO mimarileri önemli ölçüde daha hızlı eğitilir ve çok daha az CUDA belleği gerektirir, bu da onları tüketici sınıfı GPU'lar için ideal hale getirir.
Link to this sectionKod Örneği: Kolaylaştırılmış Eğitim#
En gelişmiş modelleri eğitmek, Ultralytics ekosisteminde sorunsuzdur. İşte bir YOLOv9 modelini nasıl eğitip doğrulayacağınızı gösteren tamamen çalıştırılabilir bir örnek:
from ultralytics import YOLO
# Initialize the model (you can swap 'yolov9c.pt' with 'yolov7.pt' or 'yolo26n.pt')
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 sample dataset
train_results = model.train(
data="coco8.yaml",
epochs=50,
imgsz=640,
device="0", # Use GPU 0 if available
batch=16, # Optimized batch size for memory efficiency
)
# Validate the model's performance on the validation set
metrics = model.val()
# Export the trained model to ONNX format for deployment
model.export(format="onnx")Link to this sectionGörevler Arasında Eşsiz Çok Yönlülük#
İyi bakılan bir ekosistem, çeşitli bilgisayarlı görü görevlerine erişim anlamına gelir. YOLOv7 temel olarak nesne algılama için oluşturulmuşken (diğer görevler için daha sonra deneysel çatalları olsa da), modern Ultralytics modelleri doğal olarak çok yönlülük için oluşturulmuştur. Kutudan çıktığı gibi örnek bölütleme, poz tahmini, görüntü sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılama işlemlerini sorunsuz bir şekilde gerçekleştirebilirsin.
Link to this sectionİdeal Kullanım Senaryoları ve Uygulamalar#
YOLOv7 ve YOLOv9 arasındaki karar, genellikle özel endüstri kısıtlamalarına ve donanım uygunluğuna bağlıdır.
Link to this sectionYOLOv7 Ne Zaman Kullanılır?#
- Eski Uç Dağıtımlar: YOLOv7'nin E-ELAN mimarisi için halihazırda yoğun bir şekilde ayarlanmış ve optimize edilmiş donanım ortamları için, endüstriyel IoT için sağlam bir seçenek olmaya devam etmektedir.
- Trafik İzleme: YOLOv7'nin yüksek kare hızları ve kanıtlanmış kararlılığı, onu akıllı şehir altyapısı ve gerçek zamanlı trafik yönetimi için mükemmel kılar.
- Robotik Entegrasyonu: Dinamik ortamlarda gezinmek, düşük gecikmeli işleme gerektirir; bu, YOLOv7 varyantlarının yoğun bir şekilde test edildiği bir senaryodur.
Link to this sectionYOLOv9 Ne Zaman Kullanılmalı#
- Tıbbi Görüntüleme: YOLOv9'daki PGI mimarisi, tümör tespiti gibi karmaşık tıbbi görüntü analizi görevlerini analiz ederken derin katmanlar boyunca ince ayrıntıları koruma konusunda olağanüstüdür.
- Yoğun Perakende Analitiği: Perakende raflarındaki yoğun paketlenmiş ürünleri takip etmek ve saymak için, YOLOv9'un özellik entegrasyonu üstün doğruluk sağlar ve yanlış negatifleri azaltır.
- Hava ve Drone Görüntüleri: YOLOv9m'nin parametre verimliliği, dronlarda yüksek çözünürlüklü görüntü işlemeye olanak tanır, bu da pil ömrünü tüketmeden yaban hayatı koruma ve tarımsal izlemeye yardımcı olur.
Link to this sectionSonuç#
Hem YOLOv7 hem de YOLOv9, bilgisayarlı görü tarihindeki yerlerini sağlamlaştırdı. YOLOv7 gerçek zamanlı işleme için temel optimizasyonları getirirken, YOLOv9 parametre verimliliğini en üst düzeye çıkarmak için yapısal derin öğrenme darboğazlarını ele aldı.
Ancak bugün yeni projelere başlayan geliştiriciler için, Ultralytics ekosisteminden yararlanmak —özellikle YOLO11 ve YOLO26 gibi yeni nesil modeller— hız, doğruluk ve geliştirici deneyimi arasında en uygun dengeyi sunar. MuSGD optimize edici ve daha geniş donanım uyumluluğu için Dağılım Odaklı Kaybın (DFL) kaldırılması gibi yeniliklerle Ultralytics, yapay zeka profesyonelleri için en erişilebilir ve güçlü araçları sağlamaya devam ediyor.