Link to this sectionYOLOX ve YOLOv9#
Bilgisayarlı görü dünyası, hesaplama verimliliği ile yüksek hassasiyeti dengeleyen sürekli mimari atılımlarla şekillenmiştir. Gerçek zamanlı nesne algılama modellerini değerlendirirken, Megvii'nin YOLOX'u ile Academia Sinica'nın YOLOv9'u arasındaki karşılaştırma, derin öğrenme geliştirmede iki farklı felsefeyi öne çıkarır. Biri basitleştirilmiş çapasız (anchor-free) paradigmasının öncülüğünü yaparken, diğeri bilgi tutarlılığını en üst düzeye çıkarmak için gelişmiş gradyan yönlendirme teknikleri getirdi.
Bu teknik kılavuz, mimari inceliklerini, performans karşılaştırmalarını ve ideal kullanım durumlarını incelerken, Ultralytics Platform gibi modern çözümlerin ve yeni yayınlanan YOLO26 modelinin üretime hazır dağıtımlar için nasıl üstün alternatifler sunduğunu göstermektedir.
Link to this sectionYOLOX: Çapasız Paradigmanın Öncüsü#
2021 ortalarında yayınlanan YOLOX, akademik araştırmalar ile endüstriyel uygulamalar arasındaki boşluğu doldurma yolunda büyük bir adımdı. Önceden tanımlanmış çapa kutularına (anchor boxes) olan ihtiyacı ortadan kaldırarak, özel veri setleri için gereken sezgisel ayarlamaları önemli ölçüde basitleştirdi.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Yayın Tarihi: 18 Temmuz 2021
- Referans: Arxiv Makalesi
- Kaynak Kod: YOLOX GitHub Deposu
- Dokümantasyon: YOLOX Resmi Dokümanları
Link to this sectionMimari Yenilikler#
YOLOX, standart algılama hattına birkaç temel değişiklik getirdi. Sınıflandırma ve regresyon görevlerini ayıran ayrıştırılmış bir başlık (decoupled head) uyguladı; bu, bir nesneyi tanımlama ile sınırlarını belirleme arasındaki çatışmayı önemli ölçüde azalttı. Ayrıca YOLOX, eğitim sırasında pozitif örnekleri dinamik olarak tahsis eden gelişmiş bir etiket atama stratejisi olan SimOTA'yı benimseyerek, standart kıyaslama veri setlerinde daha hızlı yakınsama ve daha iyi genel performans sağladı.
Link to this sectionGüçlü ve Zayıf Yönler#
YOLOX'un temel gücü basitleştirilmiş tasarımında yatar. Çapasız mekanizma, geliştiricilerin verileri için en uygun çapa boyutlarını bulmak adına kümeleme algoritmalarını çalıştırmaya daha az zaman harcaması anlamına gelir. Ancak, öz-dikkat (self-attention) veya gradyan yolundaki son gelişmeler olmadan yerel olarak oluşturulmuş eski bir mimari olduğundan, daha yeni ağların parametre verimliliğine ulaşmakta zorlanır. Ayrıca, birleşik bir API içinde örnek segmentasyonu ve poz tahmini gibi gelişmiş görevler için yerel destekten yoksundur.
YOLOX hakkında daha fazla bilgi edinin
Link to this sectionYOLOv9: Gradyan Bilgisini En Üst Düzeye Çıkarma#
2024'e hızlı bir bakışla, YOLOv9 derin evrişimli sinir ağlarının doğasında bulunan bilgi darboğazı problemini çözmek için oldukça teorik bir yaklaşım getirdi.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica
- Yayın Tarihi: 21 Şubat 2024
- Referans: Arxiv Makalesi
- Kaynak Kod: YOLOv9 GitHub Deposu
- Dokümantasyon: Ultralytics YOLOv9 Dokümanları
Link to this sectionMimari Yenilikler#
YOLOv9'un belirleyici özelliği, ağın birden fazla katmanından geçerken kritik anlamsal verilerin kaybolmamasını sağlayan Programlanabilir Gradyan Bilgisi'dir (PGI). Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) ile eşleştirilen YOLOv9, olağanüstü bir parametre-doğruluk oranı elde eder. Bu, modelin ağırlıkları güncellemek için doğru gradyanları korumasını sağlayarak hafif varyantlarında bile son derece etkili olmasını sağlar.
Link to this sectionGüçlü ve Zayıf Yönler#
YOLOv9, model doğruluğunun teorik sınırlarını zorlama konusunda mükemmeldir. COCO üzerinde harika mAP puanları verir, bu da onu araştırmacılar için favori kılar. Ancak, verimliliğine rağmen YOLOv9, çıkarım sırasında gecikme artışlarına neden olan son işleme için hala geleneksel Non-Maximum Suppression (NMS) yöntemine güvenir. Yapay zekayı uç cihazlara dağıtmaya odaklanan mühendisler için NMS mantığını yönetmek, dağıtım hattına gereksiz karmaşıklık ekler.
YOLOv9 hakkında daha fazla bilgi edin
YOLOX ve YOLOv9 gibi geleneksel modeller, mükerrer sınırlayıcı kutuları filtrelemek için Non-Maximum Suppression (NMS) gerektirir. Bu adım doğası gereği sıralıdır ve genellikle CPU'larda bir darboğaz oluşturur; bu da en son Ultralytics modellerinde bulunan yerel uçtan uca mimarilere duyulan ihtiyacı vurgular.
Link to this sectionPerformans Karşılaştırması#
Bu mimarilerin ham hesaplama metriklerini karşılaştırırken, YOLOv9'un daha modern bir temel sunduğu, YOLOX'un ise eski sistemler için hafif bir seçenek olarak kaldığı açıktır. Standart modellerinin ayrıntılı bir dökümü aşağıdadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv9 karşılaştırılabilir parametre sayıları arasında üstün doğruluk gösterse de, hız, doğruluk ve kullanım kolaylığı açısından nihai dengeyi arayan geliştiriciler, Ultralytics'in sunduğu en son gelişmeleri dikkate almalıdır.
Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#
YOLOX ve YOLOv9 gibi geçmiş modelleri değerlendirmek değerli bir bağlam sağlasa da, günümüzün son teknolojisi Ultralytics YOLO26 ile tanımlanmaktadır. 2026'nın başlarında piyasaya sürülen YOLO26, modern kurumsal ortamlar için algılama hattını temelden yeniden mimarilendirir.
Link to this sectionEşsiz Mimari Yenilikler#
YOLO26, tüm donanımlarda daha basit bir dağıtım sağlamak için yerel uçtan uca NMS içermeyen tasarım ile seleflerinin son işleme darboğazlarını tamamen çözer. Ayrıca, Dağılımsal Odak Kaybını (DFL) kaldırarak ve Stokastik Gradyan İnişi ile Muon'un bir hibriti olan yeni MuSGD Optimizer'ı entegre ederek, YOLO26 benzeri görülmemiş bir eğitim kararlılığına ulaşır.
Raspberry Pi gibi kısıtlı ortamlara dağıtım yapan geliştiriciler için YOLO26, %43'e kadar daha hızlı CPU çıkarımı sağlar. Ayrıca, hava görüntüleri ve drone analitiği için kritik olan küçük nesne tanımada dramatik iyileştirmeler sağlayan ProgLoss + STAL kayıp fonksiyonlarını sunar.
Link to this sectionKolaylaştırılmış Geliştirme Ekosistemi#
Bağımsız araştırma depolarından farklı olarak, Ultralytics ekosistemi benzersiz bir geliştirici deneyimi sunar. Ultralytics Python API kullanarak, mühendisler standart kodları (boilerplate code) önemli ölçüde azaltabilirler. Ayrıca, bellek gereksinimleri oldukça optimize edilmiş tutulur; bu da büyük oranda dikkat tabanlı mimarilere kıyasla daha az GPU VRAM kullanarak güçlü modeller eğitebileceğiniz anlamına gelir.
from ultralytics import YOLO
# Load the highly optimized, NMS-free YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Easily export to optimized deployment formats
model.export(format="engine", quantize=16) # Exports to TensorRTAlgılamanın ötesinde YOLO26, tam olarak aynı çerçeve içinde çok sayıda görevi sorunsuz bir şekilde destekler. İster uydu görüntüleme için hassas Yönlendirilmiş Sınırlayıcı Kutular (OBB), ister tıbbi görüntüleme uygulamaları için ince taneli piksel maskeleri gerekiyor olsun, iş akışı aynı kalır. Önceki nesil iş akışlarına yatırım yapan ekipler için Ultralytics YOLO11 de mevcuttur ve tamamen desteklenmektedir.
Link to this sectionİdeal Kullanım Senaryoları ve Dağıtım Stratejileri#
Doğru mimariyi seçmek tamamen hedef dağıtım ortamınıza ve proje gereksinimlerinize bağlıdır.
Link to this sectionUç Bilişim ve Robotik#
Düşük güçlü cihazlar için, yoğun son işleme gerektiren modellere güvenmek performansı ciddi şekilde aksatabilir. YOLOX-Nano inanılmaz derecede küçük olsa da, doğruluğu genellikle güvenlik açısından kritik görevler için yetersizdir. YOLO26 burada kesin tercihtir; DFL ve NMS eksikliği, ham CPU iş parçacıkları üzerinde sorunsuz bir şekilde çalışmasını sağlar ve bu da onu otonom robotik veya akıllı park yönetimi için mükemmel kılar.
Link to this sectionAkademik Kıyaslama#
Tek amaç gradyan akışını analiz etmek ve derin ağ darboğazlarını incelemekse, YOLOv9 mükemmel bir çalışma konusudur. PGI çerçevesi, özelliklerin derin sinir ağı katmanlarında nasıl korunduğuna dair büyüleyici bilgiler sunarak, evrişim teorisini keşfeden üniversite araştırmacıları için değerli bir araç haline gelir.
Link to this sectionKurumsal Video Analitiği#
Güvenlik alarm sistemleri veya trafik izleme gibi büyük ölçekli video işleme görevleri için hız ve çok yönlü dışa aktarma yetenekleri çok önemlidir. Ultralytics çerçevesi tarafından sağlanan yerel dışa aktarma araçları, ekiplerin YOLO26'yı doğrudan tek bir komutla TensorRT veya OpenVINO formatına derlemesine olanak tanır ve pazara giriş süresini önemli ölçüde kısaltır.
Ultralytics ekosisteminin kapsamlı özelliklerinden yararlanarak, makine öğrenimi ekipleri ham araştırma kod tabanlarının karmaşıklığını atlayabilir ve doğrudan ölçeklenebilir, gerçek dünya yapay zeka uygulamaları oluşturmaya odaklanabilirler.