YOLO YOLOv6.0: Gerçek Zamanlı Nesne Algılama için Teknik Karşılaşma
Gerçek zamanlı nesne algılama alanı, mimari verimlilik ve çıkarım hızının ön planda olduğu hızlı inovasyonla karakterize edilir. Bu alanda öne çıkan iki önemli rakip, Alibaba Group tarafından geliştirilen YOLO ve Meituan'ın sağlam bir çerçevesi olan YOLOv6.YOLOv6'dır. Her iki model de gecikme süresi ve doğruluk arasında mükemmel bir denge kurmayı amaçlamaktadır, ancak bunu farklı metodolojilerle başarmaktadır.
Bu kapsamlı kılavuz, her iki mimarinin teknik nüanslarını ayrıntılı olarak inceleyerek, geliştiricilere ve araştırmacılara bilgisayar görme uygulamaları için doğru aracı seçmeleri için gerekli bilgileri sunar. İster uç cihazlar ister yüksek verimli bulut sunucuları için geliştirme yapıyor olun, bu farklılıkları anlamak çok önemlidir.
Performans Kıyaslaması
Aşağıdaki tablo, COCO indeki performans ölçütlerini göstermektedir. YOLOv6.YOLOv6, TensorRT tasarımı sayesinde GPU genellikle üstün verimlilik sunarken, YOLO güçlü parametre verimliliği sergilemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
DAMO-YOLO: Sinirsel Mimari Arama Verimlilikle Buluşuyor
YOLO, Sinir Mimarisi Arama (NAS) teknolojisini doğrudan backbone entegre ederek yeni bir yaklaşım sunuyor. Alibaba Group tarafından geliştirilen bu teknoloji, sıkı gecikme kısıtlamaları altında performansı en üst düzeye çıkarmaya odaklanıyor.
Temel Mimari Özellikler
- MAE-NAS Backbone: Optimum ağ yapılarını keşfetmek için Çok Dallı Otomatik Kodlayıcı Sinir Ağı Mimarisi Arama (MAE-NAS) kullanır. Bu, CSPDarknet gibi elle oluşturulmuş muadillerinden daha verimli bir şekilde özellikleri çıkaran bir backbone ile sonuçlanır.
- Verimli RepGFPN: Model, standart Özellik Piramit Ağı (FPN) yerine Yeniden Parametreleştirilmiş Genelleştirilmiş FPN (RepGFPN) kullanır. Bu, karmaşık dallar dağıtım sırasında tek bir yola birleştirildiğinden, çıkarım hızını korurken farklı ölçekler arasında özellik birleştirmeyi iyileştirir.
- ZeroHead: Hesaplama maliyetini daha da azaltmak içinYOLO , önemli bir doğruluk kaybı olmadan algılama kafası tasarımını basitleştiren hafif bir "ZeroHead"YOLO .
- AlignedOTA: Eğitim süreci, yakınsama hızını artırmak ve kalabalık sahnelerdeki belirsizlikleri gidermek için etiketleri dinamik olarak atayan Aligned One-to-Many (AlignedOTA) etiket atama yöntemini kullanır.
YOLO :
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arxiv | GitHub | Dokümanlar
YOLOv6.0: GPU'lar için Endüstri Standardı
YOLOv6.YOLOv6, genellikle çerçevenin "tam ölçekli yeniden yüklemesi" olarak adlandırılır ve özellikle GPU aracılığıyla endüstriyel uygulamalar için tasarlanmıştır. TensorRT tarafından GPU çıkarımının norm olduğu endüstriyel uygulamalar için özel olarak tasarlanmıştır.
Temel Mimari Özellikler
- Çift Yönlü Füzyon (BiFusion): YOLOv6.0, BiFusion ile boynu geliştirerek farklı özellik düzeyleri arasında anlamsal bilginin akışını iyileştirir.
- Anchor-Aided Training (AAT): Tamamen ankarsız dedektörlerin aksine, YOLOv6. YOLOv6 eğitim sırasında yardımcı ankarsız bir dal ekler. Bu, öğrenme sürecini stabilize eder ve geri çağırmayı artırırken, hız için çıkarım ankarsız kalır.
- RepOptimizer: Model, yeniden parametreleştirme tekniklerini sadece mimaride (RepVGG blokları) değil, aynı zamanda optimizasyon sürecinde de kullanarak, gradyan iniş adımlarının yeniden parametreleştirilmiş belirli yapılar için daha etkili olmasını sağlar.
- Quantization Aware Training (QAT): En büyük gücü, QAT için yerel desteği olup, modelin kenar GPU'larda dağıtım için INT8 hassasiyetine sıkıştırıldığında bile yüksek doğruluğu korumasını sağlar.
YOLOv6.YOLOv6 Ayrıntılar:
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv | GitHub | Dokümanlar
YOLOv6 hakkında daha fazla bilgi edinin.
Ultralytics : Neden Modern YOLO Seçmelisiniz?
YOLO YOLOv6.0 farklı güçlü yönlere sahip olsa da, Ultralytics ekosistemi, modern AI geliştirmenin daha geniş ihtiyaçlarını karşılayan birleşik bir çözüm sunar. Ultralytics seçmek, sadece bir mimari değil, eksiksiz ve desteklenen bir iş akışı elde etmenizi sağlar.
1. Eşsiz Kullanım Kolaylığı
Ultralytics , geliştirici deneyimini ("sıfırdan kahramana") Ultralytics . Veri artırma, hiperparametre ayarlama ve model dışa aktarma gibi karmaşık süreçler, basit bir Python arkasında soyutlaştırılmıştır.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100)
2. Görevler Arasında Çok Yönlülük
Öncelikle sınırlayıcı kutu algılamaya odaklananYOLO YOLOv6 farklı olarak, Ultralytics doğası gereği çok modludur. Tek bir kod tabanı şunları destekler:
- Nesne Algılama: Nesneleri ve konumlarını tanımlama.
- Örnek Segmentasyonu: Nesnelerin tam piksel sınırlarını belirleme.
- Poz Tahmini: İnsan veya hayvan takibi için kilit noktaları tespit etme.
- Sınıflandırma: Görüntülere genel etiketler atama.
- Yönlendirilmiş Sınır Kutusu (OBB): Hava görüntüleri ve metin tespiti için kritik öneme sahip, döndürülmüş nesneleri algılama.
3. Eğitim Verimliliği ve Bellek Kullanımı
Ultralytics , eğitim sırasında VRAM kullanımını en aza indirecek şekilde optimize edilmiştir. Bu verimlilik, araştırmacıların ve hobisi olanların tüketici sınıfı GPU'larda en son teknolojiye sahip modelleri eğitmelerine olanak tanır. Bu, bellek gereksinimi yüksek transformatör hibritlerine kıyasla önemli bir avantajdır. RT-DETRgibi bellek tüketen dönüştürücü hibritlerine göre önemli bir avantaj sağlar.
4. İyi Korunmuş Ekosistem
Ultralytics , bilgisayar görme topluluğunda en aktif depolardan biridir. Sık sık yapılan güncellemeler, en son sürümlerle uyumluluğu sağlar. PyTorch, CUDA ve Python ile uyumluluğu sağlar ve statik araştırma depolarında sıklıkla görülen "kod çürümesi"ni önler.
Görme Yapay Zekasının Geleceği: YOLO26
En üst düzey performans ve kolay kurulum arayan geliştiriciler için Ultralytics , yeni nesil görsel yapay zeka teknolojisini temsil ediyor.
Neden YOLO26'ya yükseltmelisiniz?
YOLO26, hız ve doğruluğu artırırken dağıtımı basitleştiren en son teknoloji özellikleri bir araya getirir:
- Uçtan uca NMS: Maksimum Baskı Önleme (NMS) son işlemlerini ortadan kaldırarak, dışa aktarımı kolaylaştırır. CoreML ve TFLite'e aktarımı kolaylaştırır.
- CPU : Önceki nesillere kıyasla %43'e kadar daha hızlı CPU , güçlü GPU'lara sahip olmayan uç cihazlarda gerçek zamanlı performans elde edin.
- MuSGD Optimizer: Daha hızlı yakınsama ve kararlılık için LLM eğitimindeki yeniliklerden (Moonshot AI'nın Kimi K2'sinden esinlenerek) yararlanan hibrit bir optimizer.
- Geliştirilmiş Küçük Nesne Algılama: Yeni
ProgLossveSTALkayıp fonksiyonları, küçük ve zor hedeflerin tespitini önemli ölçüde iyileştirir, bu da drone uygulamaları.
YOLO26 hakkında daha fazla bilgi edinin
Kullanım Durumu Önerileri
Bu mimariler arasında karar verirken, özel dağıtım ortamınızı göz önünde bulundurun:
YOLO için ideal
- Araştırma ve Geliştirme: Sinir Mimarisi Arama (NAS) yönteminin görme omurgaları üzerindeki etkisini incelemek için mükemmel bir araçtır.
- Özel Donanım: Yapı, RepGFPN tasarımını destekleyen belirli NPU'larda avantajlar sunabilir.
- Düşük Gecikme Süresi Gereksinimleri: ZeroHead tasarımı, zaman kısıtlamalarının çok katı olduğu ortamlarda milisaniye düzeyinde zaman tasarrufu sağlar.
YOLOv6.0 için ideal
- Endüstriyel GPU : TensorRT optimizasyonuna yoğun bir şekilde odaklanılması, onu NVIDIA ve A100 kartlarında bir canavar haline getiriyor.
- Kuantizasyon İhtiyaçları: INT8 dağıtımı için boru hattınız Kuantizasyon Duyarlı Eğitime (QAT) büyük ölçüde bağlıysa, YOLOv6 yerel araçlar YOLOv6 .
- Yüksek Verimli Analitik: Toplu işleme verimliliğinin önemli olduğu, birden fazla video akışını aynı anda işleme gibi senaryolar.
Ultralytics YOLO11 YOLO26) için ideal
- Genel Amaçlı Dağıtım: Aşağıdakilere aktarma yeteneği ONNX, OpenVINO, TensorRT, CoreML ve TFLite tek bir TFLite dışa aktarma yeteneği tüm temel ihtiyaçları karşılar.
- Mobil ve Kenar CPU:YOLO26'nın özel CPU ve NMS tasarımı, onu iOS, Android ve Raspberry Pi dağıtımları için üstün bir seçim haline getirir.
- Karmaşık Görevler: Projeniz segmentasyon maskeleri veya poz anahtar noktaları gibi kutulardan daha fazlasını gerektirdiğinde,Ultralytics bunu sağlayan tek birleşikUltralytics .
- Hızlı Prototipleme: Ultralytics , karmaşık altyapıyı yönetmeye gerek kalmadan hızlı veri kümesi yönetimi, eğitim ve dağıtım imkanı sunar.
Sonuç
Hem YOLO hem de YOLOv6.YOLOv6, bilgisayar görme alanına etkileyici katkılar sağlamaktadır.YOLO , otomatik mimari aramanın sınırlarınıYOLO , YOLOv6 ise GPU çıkarım sanatını YOLOv6 .
Ancak, gerçek dünyadaki uygulamaların büyük çoğunluğu için Ultralytics YOLO daha dengeli, çok yönlü ve sürdürülebilir bir çözüm sunar. YOLO26'nın piyasaya sürülmesiyle birlikte, bu fark daha da artarak rakip modellerin henüz ulaşamadığı uçtan uca verimlilik ve CPU sunmaktadır. İster ilk AI ürününüzü geliştiren bir startup ister milyonlarca kullanıcıya hizmet veren bir kurumsal şirket olun, Ultralytics istikrarı ve performansı başarı için sağlam bir temel sağlar.
Daha Fazla Okuma
Ultralytics diğer son teknoloji modelleri ve araçları keşfedin:
- YOLOv8 - Kararlılığıyla tanınan klasik SOTA modeli.
- RT-DETR - Yüksek hassasiyetli görevler için gerçek zamanlı algılama dönüştürücüsü.
- YOLOv9 - Programlanabilir Gradyan Bilgisi (PGI) özelliğine sahiptir.
- YOLOv10 - NMS eğitimin öncüsü.
- YOLO11 - Mevcut neslin güçlü bir öncülü.