YOLO . YOLO26: Gerçek Zamanlı Nesne Algılama için Teknik Karşılaşma
Bilgisayar görüşünün gelişimi, verimlilik, hız ve doğruluk arayışıyla şekillenmiştir. Bu alanda öne çıkan iki isim, Alibaba Group tarafından geliştirilenYOLO ve Ultralytics en son sürümü olan YOLO26'dır.YOLO , 2022 yılında Sinirsel Mimari Arama (NAS) alanında önemli yeniliklerYOLO , YOLO26, uç dağıtım ve üretim ölçeklenebilirliği için özel olarak tasarlanmış, uçtan uca, NMS tasarımıyla 2026 yılında bu alandaki durumu yeniden tanımlamaktadır.
Bu kılavuz, bu iki modelin mimarilerini, performans ölçütlerini ve gerçek dünya uygulamaları için uygunluklarını karşılaştırarak derinlemesine bir teknik analiz sunmaktadır.
YOLO: Sinir Mimarisi Arama İnovasyonu
Alibaba'nın DAMO Akademisi tarafından geliştirilen YOLO (Distillation-Enhanced Neural Architecture Search-based YOLO), belirli gecikme kısıtlamaları altında performansı en üst düzeye çıkarmak için algılama omurgalarının tasarımını otomatikleştirmeye odaklanmaktadır.
Temel Mimari Özellikler
YOLO , birçok ileri teknoloji ile öneYOLO :
- Sinir Mimarisi Arama (NAS): Manuel olarak tasarlanmış omurgalardan (CSPDarknet gibi) farklı olarak,YOLO , optimum yapıları keşfetmek için MAE-NAS (Verimli Sinir Mimarisi Arama Otomasyon Yöntemi)YOLO . Bu, kayan nokta işlemleri (FLOP) ve doğruluk arasındaki dengeyi sağlamak için özel olarak ayarlanmış bir ağ topolojisi ile sonuçlanır.
- RepGFPN: Yeniden parametreleştirme ile birlikte Genelleştirilmiş Özellik Piramidi Ağları (GFPN) kullanan ağır boyun tasarımı. Bu, farklı ölçekler arasında verimli özellik birleştirme sağlar ve farklı boyutlardaki nesnelerin algılanmasını iyileştirir.
- ZeroHead: Çıkarım sırasında hesaplama yükünü azaltan basitleştirilmiş algılama kafası.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki uyumsuzluğu çözen dinamik bir etiket atama stratejisidir.
Performans ve Sınırlamalar
YOLO , 2022 yılında önemli bir sıçramaYOLO ve önceki versiyonları geride bıraktı. YOLOv6 ve YOLOv7 gibi önceki sürümleri geride bırakarak önemli bir sıçrama kaydetti. Ancak, karmaşık eğitim süreçlerine, özellikle de büyük bir öğretmen modeliyle damıtma aşamasına ihtiyaç duyması, özel veri kümeleri üzerinde hızlı bir şekilde yineleme yapması gereken geliştiriciler için zorluk yaratabilir. Ayrıca, RepGFPN güçlü olmakla birlikte, modern mimarilere kıyasla bellek açısından yoğun olabilir.
DAMO-YOLO Detayları:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: YOLO
Ultralytics : Uçtan Uca Kenar Devrimi
2026 yılının Ocak ayında piyasaya sürülen Ultralytics , YOLOv8 ve YOLO11'nin mirasını temel alarak, algılamaların işlenme biçiminde köklü bir değişiklik getiriyor. YOLO26, sadece yüksek benchmark puanları elde etmek için değil, bulut sunucularından kaynak kısıtlı IoT cihazlarına kadar her şeyde pratik ve sorunsuz bir şekilde kullanılmak üzere tasarlanmıştır.
Çığır Açan Mimari
YOLO26, geleneksel çapa tabanlı veya çapasız dedektörlerden ayıran birkaç son teknoloji gelişmeyi bünyesinde barındırır:
- Uçtan Uca NMS Tasarım: Belki de en önemli değişiklik, Maksimum Baskılama (NMS) özelliğinin kaldırılmasıdır. Eğitim sırasında bire bir eşleştirme stratejisi benimsenerek (ilk kez YOLOv10'de öncülüğünü yaptığı) bire bir eşleştirme stratejisi benimseyerek, model doğrudan nihai tahminleri çıkarır. Bu, kalabalık sahnelerde genellikle bir darboğaz oluşturan NMS kaynaklanan gecikme varyansını ortadan kaldırır.
- MuSGD Optimizer: Moonshot AI'nın Kimi K2 gibi Büyük Dil Modeli (LLM) eğitimindeki yeniliklerden esinlenerek, YOLO26, SGD Muon'u birleştiren hibrit bir optimizer kullanır. Bu, bilgisayar görme eğitimine benzeri görülmemiş bir istikrar getirerek daha hızlı yakınsama sağlar.
- DFL Kaldırma: Dağıtım Odak Kaybını kaldırarak, çıktı katmanı basitleştirilir. Bu, ONNX ve TensorRT dönüştürme işlemini çok daha temiz hale getirir ve uç cihazlar ve düşük güçlü mikrodenetleyicilerle uyumluluğu önemli ölçüde artırır.
- ProgLoss + STAL: Progressive Loss ve Soft-Target Anchor Labeling (STAL) teknolojilerinin entegrasyonu, hava görüntüleme ve robotik için kritik öneme sahip olan küçük nesne algılamada önemli iyileştirmeler sağlar.
Dağıtım Üstünlüğü
YOLO26 hız için tasarlanmıştır. Önceki nesillere kıyasla %43'e kadar daha hızlı CPU sahiptir, bu da onu Raspberry Pi, mobil CPU'lar veya Intel PC'lerde çalışan uygulamalar için ideal bir seçim haline getirir.
YOLO26 hakkında daha fazla bilgi edinin
YOLO26 Detayları:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 2026-01-14
- Belgeler: YOLO26 Belgeleri
- GitHub: ultralytics
Karşılaştırmalı Performans Analizi
Aşağıdaki tablo, çeşitli model boyutlarındaYOLO YOLO26'nın performansını karşılaştırmaktadır. YOLO26, özellikle NMS öne çıktığı CPU , önemli ölçüde daha düşük gecikme mAP karşılaştırılabilir veya daha iyi mAP elde ederek üstün verimlilik sergilemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Gecikme Avantajı
The CPU ONNX hızları, NMS tasarımın büyük avantajını ortaya koymaktadır. Son işlem adımını ortadan kaldırarak, YOLO26, gerçek zamanlı video analizi için çok önemli olan çıkarım süresinin belirleyici ve tutarlı bir şekilde düşük olmasını sağlar.
Ultralytics'in Avantajı
YOLO , mimari arama konusunda ilginç akademik bilgilerYOLO , Ultralytics modern geliştirme iş akışları için tasarlanmış bütünsel bir çözüm sunar.
1. Kullanım Kolaylığı ve Ekosistem
YOLO damıtma tabanlı eğitiminin karmaşıklığı, giriş için bir engel oluşturabilir. Buna karşılık, Ultralytics "sıfırdan kahramana" bir deneyim Ultralytics . Birleşik Python ile geliştiriciler, modelleri dakikalar içinde yükleyebilir, eğitebilir ve dağıtabilir. Ultralytics , bulut eğitimi, veri kümesi yönetimi ve otomatik açıklama araçları sunarak bunu daha da basitleştirir.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100)
2. Görev Çok Yönlülüğü
YOLO öncelikle bir nesne algılamaYOLO . Ultralytics ise çok görevli bir güç merkezidir. Tek bir çerçeve şunları destekler:
- Örnek Segmentasyonu: Anlamsal segmentasyon kaybı gibi göreve özgü iyileştirmeler dahil.
- Poz Tahmini: Yüksek hassasiyetli kilit noktalar için Artık Log-Olasılık Tahmini (RLE) kullanımı.
- OBB: Uydu görüntüsü analizi için gerekli olan, Yönlendirilmiş Sınırlayıcı Kutular için özel açı kaybı.
- Sınıflandırma: Yüksek hızlı görüntü sınıflandırma.
3. Eğitim Verimliliği ve Hafıza
YOLO26, tüketici sınıfı donanımlar için optimize edilmiştir. MuSGD optimizer gibi teknikler, bellek gereksinimi yüksek transformatör hibritlerine veya eski NAS mimarilerine kıyasla daha büyük parti boyutlarıyla istikrarlı bir eğitim sağlar. AI eğitiminin bu demokratikleşmesi, en son teknolojiye sahip bir modeli ince ayarlamak için kurumsal bir H100 kümesi gerektirmediği anlamına gelir.
İdeal Kullanım Senaryoları
Doğru modeli seçmek, özel kısıtlamalarınıza bağlıdır, ancak çoğu üretim senaryosunda YOLO26 en iyi yatırım getirisini sunar.
- YOLO seçin: Nöral Mimari Arama metodolojilerini özel olarak araştıran bir araştırmacıysanız veya tinyvision kod tabanı etrafında oluşturulmuş eski bir boru hattınız varsa.
- Aşağıdaki durumlarda Ultralytics seçin:
- Kenar Dağıtımı: NMS tasarımın büyük hız artışları sağladığı Raspberry Pi, mobil cihazlar veya CPU'larda çalıştırmanız gerekir.
- Hızlı Geliştirme: Karmaşık yapılandırma TFLite eğitilmesi, doğrulanması ve CoreML TFLite gibi formatlara aktarılması kolay bir modele ihtiyacınız var.
- Karmaşık Görme Görevleri: Projeniz, nesneleri bölümlere ayırmak veya insan pozlarını izlemek gibi sınırlayıcı kutulardan daha fazlasını gerektirir.
- Uzun Vadeli Bakım: Aktif bir topluluk, sık güncellemeler ve kapsamlı belgelerle desteklenen bir modele ihtiyacınız vardır.
Sonuç
HemYOLO YOLO26, nesne algılamada önemli kilometre taşlarıdır.YOLO , otomatik mimari aramanın potansiyeliniYOLO 2022'de mümkün olanın sınırlarını zorladı. Ancak YOLO26, 2026 ve sonrası için kesin seçim olarak öne çıkıyor. NMS çözerek, CPU optimize ederek ve MuSGD gibi gelişmiş eğitim tekniklerini entegre ederek Ultralytics , sadece daha hızlı ve daha doğru değil, aynı zamanda kullanımı da önemli ölçüde daha kolay bir model Ultralytics .
Sağlam, geleceğe dönük bilgisayar görme uygulamaları geliştirmek isteyen geliştiriciler için Ultralytics , başarıya ulaşmak için gerekli araçları, modelleri ve desteği sağlar.
Diğer yüksek performanslı mimarileri keşfetmek isteyenler için, aşağıdakileri incelemeyi düşünebilirsiniz YOLO11 veya RT-DETR 'yi incelemeyi düşünün.