YOLOX ve YOLOv10: Ankarsız Algılamadan Uçtan Uca Algılamaya Evrim

Nesne algılama alanı, 2021 ile 2024 yılları arasında önemli bir değişim geçirdi. Megvii tarafından piyasaya sürülen YOLOX, çapa tabanlı yöntemlerden önemli bir dönüşüm gerçekleştirerek, araştırma temelinde en çok tercih edilen basitleştirilmiş çapa içermeyen bir tasarım sundu. Üç yıl sonra, Tsinghua Üniversitesi'nden araştırmacılar YOLOv10'i tanıttılar ve uçtan uca bir mimariyle Non-Maximum Suppression (NMS) ihtiyacını tamamen ortadan kaldırarak paradigmayı daha da ileriye taşıdılar.

Bu karşılaştırma, YOLOX'un ayrıştırılmış kafalarından YOLOv10 çift atama stratejisine kadar olan teknik atılımları inceleyerek, geliştiricilerin bilgisayar görme iş akışları için doğru aracı seçmelerine yardımcı olur.

Karşılaştırmaya Genel Bakış

Her iki model de gerçek zamanlı performans hedeflerken, algılama sorununu farklı şekillerde çözmektedir. YOLOX, dinamik etiket ataması ile eğitim sürecini basitleştirmeye odaklanırken, YOLOv10 ise son işlem darboğazlarını ortadan kaldırarak çıkarım gecikmesini YOLOv10 .

YOLOX: Bağlantısız Öncü

YOLOX, Temmuz 2021'de Zheng Ge ve Megvii ekibi tarafından tanıtıldı. YOLO ankarsız bir mekanizmaya geçirdi ve bu sayede mühendislerin ayarlaması gereken tasarım parametrelerinin (ankarsız kutu boyutları gibi) sayısını azalttı.

Anahtar Yenilik: Ayrılmış Kafa ve SimOTA (Basitleştirilmiş Optimal Taşıma Ataması).
Mimarisi: Hız ve doğruluk arasında dengeye backbone değiştirilmiş CSPDarknet backbone .
Miras Durumu: YOLOX Arxiv raporu gibi akademik makalelerde güvenilir bir temel olarak yaygın olarak kullanılmaktadır.

YOLOX hakkında daha fazla bilgi edinin

YOLOv10: Gerçek Zamanlı Uçtan Uca Algılama

YOLOv10, Mayıs 2024'te Tsinghua Üniversitesi araştırmacıları tarafından yayınlanan, NMS gecikme maliyetini ele almaktadır. Eğitim sırasında tutarlı bir çift atama stratejisi kullanarak, nesne başına bir kutu tahmin etmeyi öğrenir ve gerçek uçtan uca dağıtım sağlar.

Anahtar Yenilik: Çift etiket atamaları yoluyla NMS eğitim (denetim için bire çok, çıkarım için bire bir).
Verimlilik: Sıra kılavuzlu blok tasarımı dahil olmak üzere, bütünsel verimlilik-doğruluk odaklı model tasarımı sunar.
Entegrasyon: Kolay eğitim ve dağıtım için Ultralytics desteklenir.

YOLOv10 hakkında daha fazla bilgi edinin.

Performans Analizi

Bu nesiller arasındaki performans farkı, özellikle modern donanımlarda verimlilik (FLOP) ve çıkarım hızı açısından oldukça belirgindir. YOLOv10 , daha az parametre ile daha yüksek ortalama hassasiyet (mAP) elde etmek için daha yeni mimari bloklardan YOLOv10 .

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOXnano	416	25.8	-	-	0.91	1.08
YOLOXtiny	416	32.8	-	-	5.06	6.45
YOLOXs	640	40.5	-	2.56	9.0	26.8
YOLOXm	640	46.9	-	5.43	25.3	73.8
YOLOXl	640	49.7	-	9.04	54.2	155.6
YOLOXx	640	51.1	-	16.1	99.1	281.9

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

Önemli Farklılıklar

Gecikme: YOLOv10 , NMS YOLOv10 . Kenar cihazlarda, NMS toplam çıkarım süresinin önemli bir bölümünü NMS , bu da YOLOv10 gerçek dünya boru hatlarında YOLOv10 daha hızlı hale getirir.
Doğruluk: YOLOv10x, YOLOX-x'in parametrelerinin neredeyse iki katı olmasına rağmen (99,1 milyon karşı 56,9 milyon), %51,1 ile YOLOX-x'ten belirgin şekilde daha yüksek olan %54,4 mAP ulaşmaktadır.
Hesaplama Verimliliği: YOLOv10 FLOP sayısı, eşdeğer doğruluk için genellikle daha düşüktür, bu da GPU üzerindeki yükü ve enerji tüketimini azaltır.

Mimari Derinlemesine İnceleme

YOLOX: Ayrılmış Kafa ve SimOTA

YOLOX, ayrıştırılmış bir başlık kullanarak önceki YOLO farklılık gösterdi. Geleneksel dedektörlerde, sınıflandırma ve konum belirleme görevleri konvolüsyonel özellikleri paylaşıyordu. YOLOX bunları iki dala ayırarak yakınsama hızını ve doğruluğunu artırdı.

Ayrıca, YOLOX dinamik etiket atama stratejisi olan SimOTA'yı tanıttı. SimOTA, gerçek kutuları bağlantı noktalarına eşleştirmek için sabit kurallar yerine, eşleştirme sürecini Optimal Transport problemi olarak ele alır ve küresel maliyet hesaplamasına dayalı olarak etiketler atar. Bu yaklaşım, YOLOX'u ağır hiperparametre ayarlamaları yapmaya gerek kalmadan farklı veri kümelerinde sağlam hale getirir.

YOLOv10: Tutarlı Çift Atamalar

YOLOv10 temel katkısı, NMS modellerde görülen eğitim-çıkarım uyuşmazlığını çözmektir.

Tek-Çoklu Eğitim: Eğitim sırasında, model zengin denetim sinyalleri sağlamak için tek bir nesneye birden fazla pozitif örnek atar.
Bire Bir Çıkarım: Tutarlı bir eşleştirme metriği sayesinde, model çıkarım sırasında en iyi tek kutuyu seçmeyi öğrenir ve NMS ihtiyacını ortadan kaldırır.

Ek olarak, YOLOv10 , tam dönüştürücülerin ağır hesaplama maliyetleri olmadan küresel bağlamı etkili bir şekilde yakalamak için Büyük Çekirdekli Konvolüsyonlar ve Kısmi Öz Dikkat (PSA) modülleri YOLOv10 .

Neden NMS'siz Olması Önemli

Non-Maximum Suppression (NMS), üst üste binen sınırlayıcı kutuları filtreleyen bir son işlem algoritmasıdır. Etkili olmasına rağmen, sıralıdır ve FPGA veya NPU gibi donanımlarda hızlandırılması zordur. Bu algoritmanın kaldırılması, dağıtım sürecini tamamen belirleyici ve daha hızlı hale getirir.

İdeal Kullanım Örnekleri

Ne Zaman YOLOX Seçmeli

Akademik Temel Değerler: Bir araştırma makalesi yazıyorsanız ve karşılaştırma yapmak için temiz, standart ve bağlantısız bir dedektöre ihtiyacınız varsa.
Eski Sistemler: Megvii kod tabanında veya OpenMMLab çerçevelerinde zaten doğrulanmış ortamlar, burada tüm çıkarım motorunun yükseltilmesi mümkün değildir.

YOLOv10 Ne Zaman Tercih Edilmeli?

Düşük Gecikmeli Uygulamalar: Otonom fren sistemleri veya yüksek hızlı endüstriyel ayırma gibi, son işlemenin her milisaniyesinin önemli olduğu senaryolar.
Kaynak Kısıtlı Kenar Cihazları: Sınırlı CPU sahip cihazlar, NMS adımının kaldırılmasından büyük fayda sağlar.

Ultralytics'in Avantajı

YOLOX ve YOLOv10 güçlü mimariler YOLOv10 da, Ultralytics ham model kodu ile üretime hazır uygulamalar arasında köprü görevi görür.

Sorunsuz Entegrasyon

Ultralytics , YOLOv10 Ultralytics ve tek bir kod satırı ile modeller arasında geçiş yapmanızı sağlar. Bu, farklı API'leri veya veri formatlarını öğrenme ihtiyacını ortadan kaldırır (YOLOX için etiketleri COCO dönüştürmek gibi).

from ultralytics import YOLO

# Load YOLOv10n or the newer YOLO26n
model = YOLO("yolov10n.pt")

# Train on your data with one command
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Çok Yönlülük ve Ekosistem

Bağımsız YOLOX deposundan farklı olarak Ultralytics , algılama dışında örnek segmentasyonu, poz tahmini ve OBB gibi çok çeşitli görevleri Ultralytics . Bunların tümü, web tabanlı veri kümesi yönetimi, tek tıklamayla eğitim ve CoreML, ONNX ve TensorRT gibi formatlara dağıtım sunan Ultralytics aracılığıyla yönetilebilir.

Eğitim Verimliliği

Ultralytics bellek verimliliği için optimize edilmiştir. Bazı dönüştürücü tabanlı modeller ( RT-DETR) önemli miktarda CUDA gerektirirken, Ultralytics YOLO tüketici sınıfı GPU'larda eğitilmek üzere tasarlanmıştır ve böylece en son teknolojiye sahip yapay zekaya erişimi demokratikleştirir.

Gelecek: YOLO26

En yüksek performans ve kullanım kolaylığı arayan geliştiriciler için, YOLOv10 ötesine geçerek yeni YOLOv10 sürülen YOLO26'yi incelemenizi öneririz.

2026 yılının Ocak ayında piyasaya sürülen YOLO26, YOLOv10 NMS çığır açan özelliğini temel alır, YOLOv10 üretim istikrarı ve hızı için bu özelliği daha da geliştirir.

MuSGD Optimizer: Moonshot AI'nın LLM eğitim yeniliklerinden esinlenerek geliştirilen bu optimizer, daha hızlı yakınsama ve istikrarlı eğitim çalıştırmaları sağlar.
DFL Kaldırma: Dağıtım Odak Kaybını kaldırarak, YOLO26 model grafiğini basitleştirir, kenar cihazlara aktarımı daha sorunsuz hale getirir ve operatör uyumsuzluğuna daha az eğilimli hale getirir.
Hız: CPU için özel olarak optimize edilmiş olup, önceki nesillere kıyasla %43'e varan hız artışı sunarak standart IoT donanımları için ideal bir seçimdir.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

YOLOX, nesne algılama tarihindeki önemli bir dönüm noktası olmaya devam ediyor ve çapa içermeyen yöntemlerin en üst düzey doğruluk elde edebileceğini kanıtlıyor. YOLOv10 , gerçek uçtan uca işlemeyi mümkün kılmak NMS son darboğazını ortadan kaldırarak bir sonraki mantıklı adımı temsil etmektedir.

Ancak, sağlam ve uzun vadeli bir çözüm için Ultralytics ekosistemi, YOLO26'nınöncülüğünde en eksiksiz paketi sunar. Üstün dokümantasyon, aktif topluluk desteği ve veri açıklamalarından model dışa aktarmaya kadar her şeyi yöneten bir platform ile Ultralytics , bilgisayar görme projelerinizin prototip aşamasından üretime kadar başarılı olmasını Ultralytics .