YOLOX ve YOLO11: Araştırma ve Gerçek Dünya Uygulamaları Arasında Köprü Kurmak

Hızla gelişen nesne algılama alanında, doğru modeli seçmek genellikle en son araştırmalar ile pratik uygulama ihtiyaçları arasında denge kurmayı gerektirir. Bu karşılaştırma, iki önemli mimariyi incelemektedir: 2021 yılında piyasaya sürülen yüksek performanslı, ankrajsız bir algılayıcı olan YOLOX ve YOLO11, Ultralytics modern kurumsal uygulamalar için Ultralytics çok yönlü ve sağlam bir model. Her iki model de YOLO gelse de, mimari felsefelerinde, ekosistem desteğinde ve kullanım kolaylığında önemli farklılıklar gösterir.

Performans Metrikleri Karşılaştırması

Nesne algılayıcıları değerlendirirken, Ortalama Hassasiyet (mAP) ve çıkarım hızı gibi temel ölçütler çok önemlidir. Aşağıdaki tablo, YOLO11 yeni mimarisinin, özellikle hız-doğruluk dengesi açısından nasıl üstün verimlilik YOLO11 göstermektedir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOXnano	416	25.8	-	-	0.91	1.08
YOLOXtiny	416	32.8	-	-	5.06	6.45
YOLOXs	640	40.5	-	2.56	9.0	26.8
YOLOXm	640	46.9	-	5.43	25.3	73.8
YOLOXl	640	49.7	-	9.04	54.2	155.6
YOLOXx	640	51.1	-	16.1	99.1	281.9

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOX: Ankarsız Evrim

YOLOX, Megvii tarafından 2021 yılında YOLO ankrajsız versiyonu olarak tanıtıldı. Algılama kafasını basitleştirerek ve önceden tanımlanmış ankraj kutularına olan ihtiyacı ortadan kaldırarak akademik araştırma ile endüstriyel uygulama arasındaki boşluğu doldurmayı amaçladı.

Temel Özellikler:

Çapa içermeyen tasarım: Karmaşık çapa kutusu kümeleme sürecini ortadan kaldırarak eğitim sürecini basitleştirir.
Ayrıştırılmış Başlık: Sınıflandırma ve regresyon görevlerini farklı dallara ayırarak yakınsama hızını ve doğruluğunu artırır.
SimOTA: Pozitif örnekleri dinamik olarak atayan ve eğitim istikrarını artıran gelişmiş bir etiket atama stratejisi.

YOLOX, 2021 yılında önemli bir adım olsa da, uygulaması genellikle daha karmaşık bir kurulum gerektirir ve yeni çerçevelerde bulunan birleşik, çoklu görev desteğinden yoksundur.

YOLOX Detayları:

Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş:Megvii
Tarih: 2021-07-18
Arxiv:https://arxiv.org/abs/2107.08430
GitHub:https://github.com/Megvii-BaseDetection/YOLOX

YOLO11: Çok Yönlülük ve Ekosistem Gücü

Ultralytics tarafından piyasaya sürülen YOLO11, önceki sürümlerinin başarısını temel alarak, sadece doğru değil, aynı zamanda kullanımı ve uygulaması da son derece kolay bir model sunuyor. Çok çeşitli bilgisayar görme görevleri için kapsamlı bir çözüm olarak tasarlanmıştır.

Temel Güçlü Yönler:

Kullanım Kolaylığı: Ultralytics , sadeliği ile ünlüdür. Yükleme, eğitim ve tahmin işlemleri sadece birkaç satır kodla gerçekleştirilebilir, bu da geliştiriciler için giriş engelini önemli ölçüde azaltır.
İyi Bakımlı Ekosistem: YOLO11 , aktif bakım, sık güncellemeler ve canlı bir topluluk tarafından YOLO11 . Bu, en son sürümlerle uyumluluğu garanti eder. PyTorch sürümleriyle uyumluluğu ve hızlı hata düzeltmelerini garanti eder.
Çok yönlülük: Öncelikle bir nesne algılayıcı olan YOLOX'un aksine, YOLO11 , örnek segmentasyonu, poz tahmini, sınıflandırma ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama dahil olmak üzere birden fazla görevi YOLO11 destekler.
Eğitim Verimliliği: YOLO11 , verimli kaynak kullanımı için optimize YOLO11 ve genellikle RT-DETR.

YOLO11 hakkında daha fazla bilgi edinin

YOLO11 :

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
Belgeler:https://docs.ultralytics.com/models/YOLO11/

Biliyor muydunuz?

En son teknolojiye sahip kenar performansı için YOLO26'yı inceleyin. Ocak 2026'da piyasaya sürülen bu ürün, yerel uçtan uca NMS tasarım, MuSGD optimizer ve %43'e kadar daha hızlı CPU sahiptir, bu da onu kenar AI için en iyi seçim haline getirir.

Mimari Karşılaştırma

YOLOX ve YOLO11 arasındaki mimari farklılıklar, nesne algılama stratejilerinin zaman içindeki evrimini YOLO11 .

YOLOX Mimarisi

YOLOX, YOLOv5 e backbone bir CSPDarknet backbone kullanır, YOLOv5 ayrıştırılmış bir başlık yapısı sunar. Geleneksel YOLO , sınıflandırma ve yerelleştirme birleştirilmiş bir şekilde gerçekleştiriliyordu. YOLOX bunları iki ayrı dala ayırarak sınıflandırma güvenilirliği ile yerelleştirme doğruluğu arasındaki çelişkiyi çözmeye yardımcı oluyor. Ankraj içermeyen mekanizması, nesne algılamayı bir nokta regresyon sorunu olarak ele alıyor. Bu, model tasarımını basitleştiriyor ancak ankraj tabanlı yaklaşımlara kıyasla bazen aşırı yoğun nesne senaryolarında zorluk yaşayabiliyor.

YOLO11 Mimarisi

YOLO11 , farklı ölçeklerde özellik çıkarma yeteneklerini geliştiren rafine bir backbone boyun mimarisi YOLO11 . Daha iyi uzamsal dikkat ve özellik füzyonu için gelişmiş modülleri entegre eder. Ultralytics önemli bir avantajı, dışa aktarılabilirliğin sorunsuz entegrasyonudur. Mimari, baştan sona ONNX, TensorRTve OpenVINOile entegre olarak, eğitim sırasında gözlemlenen yüksek doğruluğun doğrudan uç cihazlarda verimli çıkarımlara dönüşmesini sağlar.

İdeal Kullanım Senaryoları

Bu modeller arasında seçim yapmak genellikle projenizin özel gereksinimlerine bağlıdır.

Ne Zaman YOLOX Seçmeli

Araştırma Temelleri: YOLOX, bağlantısız algılama yöntemlerine veya ayrıştırılmış kafaların değiştirilmesine odaklanan akademik araştırmalar için mükemmel bir referans noktasıdır.
Eski Sistemler: Megvii kod tabanına dayalı mevcut bir boru hattınız varsa veya niş bir veri kümesi için SimOTA atama stratejisine özel olarak ihtiyaç duyuyorsanız.

Ne Zaman YOLO11 Seçmeli

Hızlı Geliştirme: Veri kümesinden dağıtılmış modele hızlı bir şekilde geçmeniz gerekiyorsa, optimize edilmiş Ultralytics ve Python , YOLO11 en iyi YOLO11 getirir.
Çoklu Görev Gereksinimleri: Basit algılamadan segmentasyona veya izlemeye kadar genişleyebilecek projeler, YOLO11 birleşik çerçevesinden yararlanır.
Üretim Dağıtımı: Perakende, akıllı şehirler veya güvenlik alanlarındaki ticari uygulamalar için, YOLO11 in sağlam dışa aktarım desteği ve topluluk tarafından test edilmiş güvenilirliği, dağıtım risklerini YOLO11 .
Edge Computing: Optimize edilmiş varyantları ile YOLO11 , Raspberry Pi veya NVIDIA gibi kaynakları sınırlı cihazlarda olağanüstü bir performans YOLO11 .

Kod Karşılaştırması: Kullanım Kolaylığı

Eğitim iş akışlarını karşılaştırdığımızda kullanılabilirlik açısından belirgin bir fark göze çarpıyor.

Ultralytics YOLO11 ile eğitim: Ultralytics karmaşıklığı ortadan kaldırarak verilerinize odaklanmanızı sağlar.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

YOLOX ile eğitim: YOLOX genellikle deponun klonlanmasını, belirli bir ortamın kurulmasını ve çok sayıda argüman içeren komut satırı komut dosyaları aracılığıyla eğitimin yürütülmesini gerektirir. Bu, Python iş akışları için daha az sezgisel olabilir.

Sonuç

Hem YOLOX hem de YOLO11 , bilgisayar görme alanına önemli katkılar sağlamış yetenekli YOLO11 . YOLOX, çapa tabanlı yöntemlerin hakimiyetine meydan okudu ve ayrıştırılmış başlıklar gibi önemli kavramları ortaya attı. Ancak, günümüzde çoğu geliştirici ve işletme için YOLO11 daha cazip bir paket sunmaktadır. Yüksek performans, çok yönlülük ve eşsiz bir ekosistemin birleşimi, onu gerçek dünyadaki AI çözümleri oluşturmak için pragmatik bir seçim haline getirmektedir.

Sınırları daha da zorlamak isteyenler, özellikle uç dağıtımlar için, aşağıdakileri keşfetmenizi şiddetle tavsiye ederiz YOLO26'yi incelemenizi şiddetle tavsiye ederiz. Uçtan uca NMS tasarımı ve dağıtım odak kaybının (DFL) ortadan kaldırılmasıyla YOLO26, verimlilik ve hızda bir sonraki sıçramayı temsil ediyor.

Keşfedilecek Diğer Modeller

YOLO26: Ultralytics en son teknoloji ürünü modeli Ultralytics Ocak 2026), NMS çıkarım ve özel kayıp fonksiyonları ile öne çıkıyor.
YOLOv8: Hız ve doğruluk dengesi ile tanınan, YOLO yaygın olarak kullanılan bir klasik.
RT-DETR: Yüksek doğruluk sunan, transformatör tabanlı bir dedektör; gerçek zamanlı hızın hassasiyetten daha az önemli olduğu senaryolar için idealdir.
SAM : Meta'nın Segment Anything Modeli, sıfır atış segmentasyon görevleri için mükemmeldir.