YOLOX ve YOLOv10: Ankarsız Algılamadan Uçtan Uca Algılamaya Evrim
Nesne algılama alanı, 2021 ile 2024 yılları arasında önemli bir değişim geçirdi. Megvii tarafından piyasaya sürülen YOLOX, çapa tabanlı yöntemlerden önemli bir dönüşüm gerçekleştirerek, araştırma temelinde en çok tercih edilen basitleştirilmiş çapa içermeyen bir tasarım sundu. Üç yıl sonra, Tsinghua Üniversitesi'nden araştırmacılar YOLOv10'i tanıttılar ve uçtan uca bir mimariyle Non-Maximum Suppression (NMS) ihtiyacını tamamen ortadan kaldırarak paradigmayı daha da ileriye taşıdılar.
Bu karşılaştırma, YOLOX'un ayrıştırılmış kafalarından YOLOv10 çift atama stratejisine kadar olan teknik atılımları inceleyerek, geliştiricilerin bilgisayar görme iş akışları için doğru aracı seçmelerine yardımcı olur.
Karşılaştırmaya Genel Bakış
Her iki model de gerçek zamanlı performans hedeflerken, algılama sorununu farklı şekillerde çözmektedir. YOLOX, dinamik etiket ataması ile eğitim sürecini basitleştirmeye odaklanırken, YOLOv10 ise son işlem darboğazlarını ortadan kaldırarak çıkarım gecikmesini YOLOv10 .
YOLOX: Bağlantısız Öncü
YOLOX, Temmuz 2021'de Zheng Ge ve Megvii ekibi tarafından tanıtıldı. YOLO ankarsız bir mekanizmaya geçirdi ve bu sayede mühendislerin ayarlaması gereken tasarım parametrelerinin (ankarsız kutu boyutları gibi) sayısını azalttı.
- Anahtar Yenilik: Ayrılmış Kafa ve SimOTA (Basitleştirilmiş Optimal Taşıma Ataması).
- Mimarisi: Hız ve doğruluk arasında dengeye backbone değiştirilmiş CSPDarknet backbone .
- Miras Durumu: YOLOX Arxiv raporu gibi akademik makalelerde güvenilir bir temel olarak yaygın olarak kullanılmaktadır.
YOLOX hakkında daha fazla bilgi edinin
YOLOv10: Gerçek Zamanlı Uçtan Uca Algılama
YOLOv10, Mayıs 2024'te Tsinghua Üniversitesi araştırmacıları tarafından yayınlanan, NMS gecikme maliyetini ele almaktadır. Eğitim sırasında tutarlı bir çift atama stratejisi kullanarak, nesne başına bir kutu tahmin etmeyi öğrenir ve gerçek uçtan uca dağıtım sağlar.
- Anahtar Yenilik: Çift etiket atamaları yoluyla NMS eğitim (denetim için bire çok, çıkarım için bire bir).
- Verimlilik: Sıra kılavuzlu blok tasarımı dahil olmak üzere, bütünsel verimlilik-doğruluk odaklı model tasarımı sunar.
- Entegrasyon: Kolay eğitim ve dağıtım için Ultralytics desteklenir.
YOLOv10 hakkında daha fazla bilgi edinin.
Performans Analizi
Bu nesiller arasındaki performans farkı, özellikle modern donanımlarda verimlilik (FLOP) ve çıkarım hızı açısından oldukça belirgindir. YOLOv10 , daha az parametre ile daha yüksek ortalama hassasiyet (mAP) elde etmek için daha yeni mimari bloklardan YOLOv10 .
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Önemli Farklılıklar
- Gecikme: YOLOv10 , NMS YOLOv10 . Kenar cihazlarda, NMS toplam çıkarım süresinin önemli bir bölümünü NMS , bu da YOLOv10 gerçek dünya boru hatlarında YOLOv10 daha hızlı hale getirir.
- Doğruluk: YOLOv10x, YOLOX-x'in parametrelerinin neredeyse iki katı olmasına rağmen (99,1 milyon karşı 56,9 milyon), %51,1 ile YOLOX-x'ten belirgin şekilde daha yüksek olan %54,4 mAP ulaşmaktadır.
- Hesaplama Verimliliği: YOLOv10 FLOP sayısı, eşdeğer doğruluk için genellikle daha düşüktür, bu da GPU üzerindeki yükü ve enerji tüketimini azaltır.
Mimari Derinlemesine İnceleme
YOLOX: Ayrılmış Kafa ve SimOTA
YOLOX, ayrıştırılmış bir başlık kullanarak önceki YOLO farklılık gösterdi. Geleneksel dedektörlerde, sınıflandırma ve konum belirleme görevleri konvolüsyonel özellikleri paylaşıyordu. YOLOX bunları iki dala ayırarak yakınsama hızını ve doğruluğunu artırdı.
Ayrıca, YOLOX dinamik etiket atama stratejisi olan SimOTA'yı tanıttı. SimOTA, gerçek kutuları bağlantı noktalarına eşleştirmek için sabit kurallar yerine, eşleştirme sürecini Optimal Transport problemi olarak ele alır ve küresel maliyet hesaplamasına dayalı olarak etiketler atar. Bu yaklaşım, YOLOX'u ağır hiperparametre ayarlamaları yapmaya gerek kalmadan farklı veri kümelerinde sağlam hale getirir.
YOLOv10: Tutarlı Çift Atamalar
YOLOv10 temel katkısı, NMS modellerde görülen eğitim-çıkarım uyuşmazlığını çözmektir.
- Tek-Çoklu Eğitim: Eğitim sırasında, model zengin denetim sinyalleri sağlamak için tek bir nesneye birden fazla pozitif örnek atar.
- Bire Bir Çıkarım: Tutarlı bir eşleştirme metriği sayesinde, model çıkarım sırasında en iyi tek kutuyu seçmeyi öğrenir ve NMS ihtiyacını ortadan kaldırır.
Ek olarak, YOLOv10 , tam dönüştürücülerin ağır hesaplama maliyetleri olmadan küresel bağlamı etkili bir şekilde yakalamak için Büyük Çekirdekli Konvolüsyonlar ve Kısmi Öz Dikkat (PSA) modülleri YOLOv10 .
Neden NMS'siz Olması Önemli
Non-Maximum Suppression (NMS), üst üste binen sınırlayıcı kutuları filtreleyen bir son işlem algoritmasıdır. Etkili olmasına rağmen, sıralıdır ve FPGA veya NPU gibi donanımlarda hızlandırılması zordur. Bu algoritmanın kaldırılması, dağıtım sürecini tamamen belirleyici ve daha hızlı hale getirir.
İdeal Kullanım Örnekleri
Ne Zaman YOLOX Seçmeli
- Akademik Temel Değerler: Bir araştırma makalesi yazıyorsanız ve karşılaştırma yapmak için temiz, standart ve bağlantısız bir dedektöre ihtiyacınız varsa.
- Eski Sistemler: Megvii kod tabanında veya OpenMMLab çerçevelerinde zaten doğrulanmış ortamlar, burada tüm çıkarım motorunun yükseltilmesi mümkün değildir.
YOLOv10 Ne Zaman Tercih Edilmeli?
- Düşük Gecikmeli Uygulamalar: Otonom fren sistemleri veya yüksek hızlı endüstriyel ayırma gibi, son işlemenin her milisaniyesinin önemli olduğu senaryolar.
- Kaynak Kısıtlı Kenar Cihazları: Sınırlı CPU sahip cihazlar, NMS adımının kaldırılmasından büyük fayda sağlar.
Ultralytics'in Avantajı
YOLOX ve YOLOv10 güçlü mimariler YOLOv10 da, Ultralytics ham model kodu ile üretime hazır uygulamalar arasında köprü görevi görür.
Sorunsuz Entegrasyon
Ultralytics , YOLOv10 Ultralytics ve tek bir kod satırı ile modeller arasında geçiş yapmanızı sağlar. Bu, farklı API'leri veya veri formatlarını öğrenme ihtiyacını ortadan kaldırır (YOLOX için etiketleri COCO dönüştürmek gibi).
from ultralytics import YOLO
# Load YOLOv10n or the newer YOLO26n
model = YOLO("yolov10n.pt")
# Train on your data with one command
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Çok Yönlülük ve Ekosistem
Bağımsız YOLOX deposundan farklı olarak Ultralytics , algılama dışında örnek segmentasyonu, poz tahmini ve OBB gibi çok çeşitli görevleri Ultralytics . Bunların tümü, web tabanlı veri kümesi yönetimi, tek tıklamayla eğitim ve CoreML, ONNX ve TensorRT gibi formatlara dağıtım sunan Ultralytics aracılığıyla yönetilebilir.
Eğitim Verimliliği
Ultralytics bellek verimliliği için optimize edilmiştir. Bazı dönüştürücü tabanlı modeller ( RT-DETR) önemli miktarda CUDA gerektirirken, Ultralytics YOLO tüketici sınıfı GPU'larda eğitilmek üzere tasarlanmıştır ve böylece en son teknolojiye sahip yapay zekaya erişimi demokratikleştirir.
Gelecek: YOLO26
En yüksek performans ve kullanım kolaylığı arayan geliştiriciler için, YOLOv10 ötesine geçerek yeni YOLOv10 sürülen YOLO26'yi incelemenizi öneririz.
2026 yılının Ocak ayında piyasaya sürülen YOLO26, YOLOv10 NMS çığır açan özelliğini temel alır, YOLOv10 üretim istikrarı ve hızı için bu özelliği daha da geliştirir.
- MuSGD Optimizer: Moonshot AI'nın LLM eğitim yeniliklerinden esinlenerek geliştirilen bu optimizer, daha hızlı yakınsama ve istikrarlı eğitim çalıştırmaları sağlar.
- DFL Kaldırma: Dağıtım Odak Kaybını kaldırarak, YOLO26 model grafiğini basitleştirir, kenar cihazlara aktarımı daha sorunsuz hale getirir ve operatör uyumsuzluğuna daha az eğilimli hale getirir.
- Hız: CPU için özel olarak optimize edilmiş olup, önceki nesillere kıyasla %43'e varan hız artışı sunarak standart IoT donanımları için ideal bir seçimdir.
YOLO26 hakkında daha fazla bilgi edinin
Sonuç
YOLOX, nesne algılama tarihindeki önemli bir dönüm noktası olmaya devam ediyor ve çapa içermeyen yöntemlerin en üst düzey doğruluk elde edebileceğini kanıtlıyor. YOLOv10 , gerçek uçtan uca işlemeyi mümkün kılmak NMS son darboğazını ortadan kaldırarak bir sonraki mantıklı adımı temsil etmektedir.
Ancak, sağlam ve uzun vadeli bir çözüm için Ultralytics ekosistemi, YOLO26'nınöncülüğünde en eksiksiz paketi sunar. Üstün dokümantasyon, aktif topluluk desteği ve veri açıklamalarından model dışa aktarmaya kadar her şeyi yöneten bir platform ile Ultralytics , bilgisayar görme projelerinizin prototip aşamasından üretime kadar başarılı olmasını Ultralytics .
Daha Fazla Okuma
- YOLO Performans Metrikleri Açıklaması
- Nesne Tespiti Rehberi
- Karşılaştırma: YOLOv8 YOLOv10
- Ultralytics YOLO11