YOLOv9 ve YOLOX: Modern Nesne Algılamaya Teknik Bir Derin Dalış
Bilgisayar görüşü alanı, gerçek zamanlı nesne algılama mimarilerinde hızlı bir evrim yaşadı. Bu kılavuz, YOLOv9 ve YOLOX arasında kapsamlı bir karşılaştırma sunarak, mimari yeniliklerini, performans metriklerini ve eğitim metodolojilerini analiz etmektedir. İster üretimde yapay zeka için akıllı uygulamalar geliştiriyor olun, ister tahmine dayalı modellemeyi keşfediyor olun, bu modelleri anlamak, bir sonraki dağıtımınız için bilinçli kararlar vermenize yardımcı olacaktır.
Mimari Yenilikler
YOLOv9: Programlanabilir Gradyan Bilgisi
YOLOv9, derin sinir ağlarında doğal olarak bulunan bilgi darboğazı sorununu ele alarak bir paradigma değişimi başlattı. Temel yenilikleri arasında Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) bulunmaktadır.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 21 Şubat 2024
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
YOLOv9, ileri besleme süreci sırasında kritik özellik verilerini koruyarak, geri yayılım sırasında ağırlıkları güncellemek için kullanılan gradyanların doğru kalmasını sağlar. Bu mimari, özellik çıkarımında üstünlük sağlayarak, hava görüntüleri ve ayrıntılı tıbbi taramalar gibi karmaşık ortamlarda küçük nesneleri tespit etme konusunda oldukça yeteneklidir.
YOLOv9 hakkında daha fazla bilgi edinin.
YOLOX: Araştırma ve Endüstriyi Birleştirme
2021 ortalarında piyasaya sürülen YOLOX, YOLO serisini çapa içermeyen bir tasarıma doğru kaydırdı. Sınıflandırma ve konumlandırma görevlerini ayıran ayrık bir başlık tanıttı ve eğitim yakınsamasını iyileştirmek için SimOTA etiket atama stratejisini kullandı.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 18 Temmuz 2021
- Arxiv:2107.08430
- GitHub:Megvii-BaseDetection/YOLOX
YOLOX, zamanı için çığır açıcı olsa da, mükemmel ortalama hassasiyet (mAP) elde etmesi ve çapa kutusu hiperparametre ayarlamasını ortadan kaldırmasıyla, temel mimarisi, o zamandan beri parametre sayısını ve özellik tutmayı daha iyi dengeleyen modern ağlar tarafından geride bırakılmıştır.
YOLOX hakkında daha fazla bilgi edinin
Çapa İçermeyen Evrim
Hem YOLOX hem de daha yeni Ultralytics modelleri, çapa içermeyen tasarımları benimseyerek, hiperparametre ayarlamasının karmaşıklığını azaltır ve çeşitli veri kümelerinde genelleme yeteneğini geliştirir.
Performans Analizi
Bu modelleri MS COCO karşılaştırmasında karşılaştırdığımızda, YOLOv9'daki gelişmeler belirgin hale gelir. YOLOv9, doğruluk ve FLOPs arasında sürekli olarak daha iyi bir denge sağlar.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOX, aşırı uç durumlar için YOLOX-Nano gibi hafif varyantlar sunsa da, YOLOv9 varyantları, benzer boyutlardaki YOLOX modellerini saf doğruluk açısından sürekli olarak geride bırakır. Örneğin, YOLOv9m, YOLOXl'nin %49,7'sine kıyasla %51,4 mAP elde ederken, parametre sayısı yarıdan daha azdır (20,0M'ye karşı 54,2M).
Ultralytics'in Avantajı
Bir model seçimi, sadece mimari teoriden daha fazlasını içerir; onu çevreleyen ekosistem, geliştirme hızını ve dağıtım başarısını belirler. Ultralytics ekosistemi içinde YOLOv9'u kullanmak, eşsiz bir kullanım kolaylığı ve güçlü topluluk desteği sağlar.
Eski orijinal araştırma depolarının aksine, Ultralytics çerçevesi, karmaşık işlem hatlarını basitleştiren birleşik bir Python API'si sunar. Eğitim, birçok alternatife göre önemli ölçüde daha az GPU belleği gerektirir ve inanılmaz bir eğitim verimliliği sunar.
from ultralytics import YOLO
# Initialize the YOLOv9c model
model = YOLO("yolov9c.pt")
# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
# Export the optimized model to TensorRT format
model.export(format="engine")
Nesne tespiti, örnek segmentasyonu ve poz tahmini dahil olmak üzere birden fazla görev için yerleşik destek sayesinde, tüm kod tabanınızı değiştirmeden bilgisayar görüşü çözümlerinizi hızla yönlendirebilirsiniz.
Sorunsuz Dışa Aktarma
Uç cihaza mı dağıtıyorsunuz? Ultralytics, eğitilmiş modellerinizi tek bir komutla ONNX, TensorRT ve OpenVINO gibi yüksek düzeyde optimize edilmiş formatlara aktarmayı kolaylaştırır.
Gerçek Dünya Uygulamaları
Bu modellerin belirli güçlü yönleri, onları farklı gerçek dünya uygulamalarına uyarlar:
Yüksek Hızlı Perakende Analitiği
Gerçek zamanlı ürün tanıma gerektiren modern perakende ortamları için YOLOv9 üstün performans gösterir. Karmaşık özellik ayrıntılarını koruma yeteneği, kalabalık bir raftaki görsel olarak benzer ürünleri ayırt etmenin gerekli olduğu perakendede yapay zeka dağıtımları için mükemmel şekilde uygundur.
Eski Kenar Dağıtımları
Katı donanım sınırlamaları veya daha yeni toplama bloklarıyla zorlanan özel NPU'lar tarafından yönetilen senaryolarda, YOLOX-Nano bazen bir niş bulabilir. Saf, basitleştirilmiş evrişim desenleri, aşırı kaynak kısıtlı mikrodenetleyiciler için bazen tercih edilir.
Otonom Robotik
Robotik navigasyon için küçük nesneleri kaçırmak felaketle sonuçlanabilir. YOLOv9 içindeki GELAN mimarisi, küçük, uzaktaki engellerin özelliklerinin ağın derin katmanlarında kaybolmamasını sağlayarak, otomotivde yapay zeka uygulamaları gibi kritik güvenlik ortamlarında eski modelleri geride bırakır.
Kullanım Durumları ve Öneriler
YOLOv9 ve YOLOX arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
YOLOv9 Ne Zaman Tercih Edilmeli?
YOLOv9, aşağıdaki durumlar için güçlü bir tercihtir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için bir referans noktası olarak gerektiği senaryolar.
Ne Zaman YOLOX Seçmeli
YOLOX şunlar için önerilir:
- Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
- Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
- SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Gelecek: YOLO26 ile Tanışın
YOLOv9 etkileyici bir kilometre taşını temsil etse de, üretim ortamlarının talepleri sürekli olarak sınırları zorlamaktadır. Yeni piyasaya sürülen YOLO26, modern görüş yapay zekası için kesin standardı temsil etmektedir.
YOLO26, yerel bir Uçtan Uca NMS-Free Tasarım ile dağıtım hattını tamamen canlandırır. İşlem sonrası aşamasında karmaşık Non-Maximum Suppression ihtiyacını ortadan kaldırarak, önemli ölçüde daha düşük çıkarım gecikmesi sunar.
Ayrıca, YOLO26, LLM eğitiminden yenilikler ödünç alarak inanılmaz derecede kararlı ve hızlı yakınsama sağlayan, SGD ve Muon'un bir hibriti olan çığır açan MuSGD Optimizer'ı bünyesinde barındırır. Distribution Focal Loss (DFL) kaldırarak, YOLO26, seleflerine kıyasla %43'e kadar daha hızlı CPU çıkarımı elde eder, bu da onu uç cihazlar ve kurumsal dağıtımlar için kesinlikle en iyi seçenek haline getirir. ProgLoss ve STAL aracılığıyla küçük nesne tanımadaki önemli iyileştirmelerle, YOLO26 hem YOLOX hem de YOLOv9'u etkili bir şekilde geride bırakır.
Modern mimarileri keşfeden mühendisler için, Ultralytics paketindeki güçlü alternatifler olarak YOLO11 ve RT-DETR'ı da incelemelerini öneririz. Ultralytics Platformu'ndaki en yeni modellerin eşsiz performansından yararlanarak projenizin geleceğe hazır olmasını sağlayın.