YOLO11 - YOLOv9: Nesne Tespiti için Teknik Bir Karşılaştırma
Ultralytics, sürekli olarak en son teknoloji YOLO modellerini sunarak gerçek zamanlı nesne tespitinin sınırlarını zorlamaktadır. Bu sayfa, iki gelişmiş model arasında teknik bir karşılaştırma sunmaktadır: Ultralytics YOLO11 ve YOLOv9. Bilgisayar görüşü görevleriniz için en uygun modeli seçmenize rehberlik etmek amacıyla mimari yeniliklerini, performans ölçütlerini ve uygun uygulamalarını analiz ediyoruz.
Ultralytics YOLO11: En Son Teknoloji
Ultralytics YOLO11, Ultralytics YOLO serisindeki en yeni yineleme olup, YOLOv8 gibi önceki başarıların üzerine inşa edilmiştir. YOLO11, nesne tespiti, örnek segmentasyonu, görüntü sınıflandırması ve poz tahmini dahil olmak üzere çeşitli bilgisayar görüşü görevlerinde gelişmiş doğruluk ve verimlilik için tasarlanmıştır.
Teknik Detaylar:
- Yazarlar: Glenn Jocher, Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Belgeler: https://docs.ultralytics.com/models/yolo11/
Mimari ve Temel Özellikler
YOLO11, iyileştirilmiş özellik çıkarma ve daha hızlı işleme için tasarlanmış bir mimariye sahiptir. Genellikle öncekilerden daha az parametreyle daha yüksek doğruluk elde ederek gerçek zamanlı performansı artırır ve NVIDIA Jetson ve Raspberry Pi gibi uç cihazlardan bulut altyapısına kadar çeşitli platformlarda dağıtımı mümkün kılar. YOLO11'in temel bir avantajı, basit bir Python API'si ve kapsamlı belgeleme aracılığıyla kolaylaştırılmış bir kullanıcı deneyimi sunan iyi yönetilen Ultralytics ekosistemine sorunsuz entegrasyonudur. Bu ekosistem, kolayca erişilebilen önceden eğitilmiş ağırlıklarla verimli eğitim sağlar ve GitHub ve Discord aracılığıyla aktif geliştirme, güçlü topluluk desteği ve sık güncellemelerden yararlanır. Ayrıca, YOLO11, genellikle rakip modellerde bulunmayan bir özellik olan, algılamanın ötesinde birden fazla görüntü işleme görevini destekleyerek çok yönlülük gösterir. Ayrıca, transformatörler gibi diğer model türlerine kıyasla eğitim ve çıkarım sırasında genellikle daha düşük bellek gerektirir.
Güçlü Yönler
- Performans Dengesi: Hız ve doğruluk arasında mükemmel denge.
- Kullanım Kolaylığı: Basit API, kapsamlı dokümantasyon ve entegre ekosistem (Ultralytics HUB).
- Çok Yönlülük: Algılama, segmentasyon, sınıflandırma, poz ve OBB görevlerini destekler.
- Verimlilik: Çeşitli donanımlar için optimize edilmiştir, verimli eğitim ve daha düşük bellek ayak izi sunar.
- İyi Yönetiliyor: Aktif olarak geliştiriliyor, güçlü topluluk desteği ve sık güncellemeler.
Zayıflıklar
- Tek aşamalı bir tespit aracı olarak, bazı iki aşamalı tespit araçlarına kıyasla aşırı küçük nesnelerle ilgili zorluklarla karşılaşabilir.
- Daha büyük modeller daha fazla işlem kaynağı gerektirir, ancak genellikle transformatör tabanlı modellerden daha azdır.
İdeal Kullanım Senaryoları
YOLO11, yüksek doğruluk ve gerçek zamanlı işleme gerektiren uygulamalar için idealdir:
- Akıllı Şehirler: Trafik yönetimi ve güvenlik sistemleri için.
- Sağlık Hizmetleri: Tanısal destek için tıbbi görüntü analizinde.
- Üretim: Otomatik üretim hatlarında kalite kontrolü için.
- Tarım: Hassas tarım için mahsul sağlığı takibinde.
YOLO11 hakkında daha fazla bilgi edinin
YOLOv9: Yeni Kavramlarla Doğruluğu Geliştirme
2024'ün başlarında tanıtılan YOLOv9, derin sinir ağlarındaki bilgi kaybının üstesinden gelmeye odaklanan, nesne algılamaya önemli bir akademik katkıyı temsil etmektedir.
Teknik Detaylar:
- Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arşiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Belgeler: https://docs.ultralytics.com/models/yolov9/
Mimari ve Temel Özellikler
YOLOv9, iki önemli mimari yenilik sunar: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). PGI, kayıp fonksiyonu hesaplaması için eksiksiz girdi bilgisi sağlamak üzere tasarlanmıştır, böylece derin ağlarda performansı düşürebilen bilgi darboğazı sorununu azaltır. GELAN, parametre kullanımını ve hesaplama verimliliğini optimize eden yeni, yüksek verimli bir ağ mimarisidir. Birlikte, bu özellikler YOLOv9'un COCO veri kümesinde yeni doğruluk kıstasları belirlemesini sağlar.
Güçlü Yönler
- Enhanced Accuracy: Gerçek zamanlı nesne dedektörleri için COCO veri kümesinde birçok önceki modeli mAP'de geride bırakarak yeniState-of-the-art sonuçlar belirler.
- Gelişmiş Verimlilik: GELAN ve PGI, karşılaştırılabilir veya daha iyi performans için daha az parametre ve hesaplama kaynağı (FLOP'lar) gerektiren modellere katkıda bulunur.
- Bilgi Koruma: PGI, daha derin ve karmaşık ağların doğru bir şekilde eğitilmesi için çok önemli olan bilgi darboğazı sorununu etkili bir şekilde ele alır.
Zayıflıklar
- Eğitim Kaynakları: YOLOv9 modellerini eğitmek, YOLOv9 belgelerinde belirtildiği gibi, Ultralytics YOLOv5'e kıyasla daha fazla kaynak yoğun ve zaman alıcı olabilir.
- Daha Yeni Mimari: Farklı bir araştırma grubunun daha yeni bir modeli olduğundan, ekosistemi, topluluk desteği ve üçüncü taraf entegrasyonları, köklü Ultralytics ekosistemine göre daha az olgundur.
- Görev Çok Yönlülüğü: Öncelikle nesne algılamaya odaklanmıştır ve YOLO11 ve YOLOv8 gibi Ultralytics modellerinde bulunan segmentasyon, sınıflandırma ve poz tahmini için yerleşik desteği yoktur.
İdeal Kullanım Senaryoları
YOLOv9, mümkün olan en yüksek nesne algılama doğruluğunu elde etmenin öncelikli hedef olduğu uygulamalar için çok uygundur:
- Gelişmiş Video Analitiği: Karmaşık sahnelerde yüksek hassasiyetli izleme ve analiz.
- Yüksek Hassasiyetli Endüstriyel Denetim: Üretimde çok küçük kusurları tespit etme.
- Araştırma ve Kıyaslama: Standart veri kümelerinde algılama doğruluğunun sınırlarını zorlamak.
YOLOv9 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: YOLO11 - YOLOv9
Hem YOLO11 hem de YOLOv9, geliştiricilerin özel ihtiyaçları için hız ve doğruluk arasında doğru dengeyi bulmalarına olanak tanıyan bir dizi model boyutu sunar. Aşağıdaki tablo, COCO veri kümesindeki performans metriklerinin doğrudan bir karşılaştırmasını sağlar.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Verilerden, YOLO11 modellerinin olağanüstü bir performans dengesi sunduğunu görebiliriz. Örneğin, YOLO11s, daha az FLOP ile YOLOv9s'den daha yüksek bir mAP elde ediyor. Benzer şekilde, YOLO11l, önemli ölçüde daha düşük FLOP'lere ve daha hızlı GPU çıkarım hızına sahipken, YOLOv9c'yi doğrulukta geride bırakıyor. En büyük YOLOv9-E modeli en yüksek mAP'ye ulaşsa da, YOLO11, özellikle Ultralytics çerçevesi tarafından sağlanan kapsamlı hız kıyaslamaları ve dağıtım kolaylığı göz önüne alındığında, model aralığı genelinde daha pratik bir denge sağlıyor.
Mimari ve Ekosistem Farklılıkları
Temel fark, tasarım felsefelerinde yatmaktadır. Ultralytics YOLO11 uygulayıcılar için üretilmiştir. Mimarisi sadece performans için değil, aynı zamanda kullanılabilirlik, çok yönlülük ve entegrasyon için de optimize edilmiştir. Birleşik çerçeve, karmaşık yapay zeka sistemleri için geliştirme süresini önemli ölçüde azaltan çoklu görevleri kutudan çıkar çıkmaz destekler. Ultralytics HUB, kapsamlı dokümantasyon ve aktif topluluk dahil olmak üzere çevreleyen ekosistem, onu üretime hazır uygulamalar oluşturmak ve dağıtmak için gidilecek bir seçenek haline getiriyor.
YOLOv9 ise, çığır açan akademik kavramlar sunan araştırma odaklı bir modeldir. Gücü, bilgi kaybı gibi derin öğrenme zorluklarını çözmeye yönelik yeni yaklaşımındadır. Güçlü olmasına rağmen, bu odak Ultralytics modellerini tanımlayan bütünsel, geliştirici dostu ekosistemden yoksun olduğu anlamına gelir. YOLOv9'u çoklu görev hattına entegre etmek veya çeşitli donanımlara dağıtmak daha fazla manuel çaba ve uzmanlık gerektirebilir.
Sonuç: Hangi Modeli Seçmelisiniz?
Geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için Ultralytics YOLO11 önerilen seçimdir. Yüksek performans, hız, çok yönlülük ve benzersiz kullanım kolaylığının üstün bir kombinasyonunu sunar. Sağlam ekosistem ve aktif bakım, konseptten üretime hızlı ve verimli bir şekilde geçebilmenizi sağlar. Tek bir çerçeve içinde algılama, segmentasyon, sınıflandırma ve daha fazlasını işleme yeteneği, onu güçlü ve geleceğe yönelik bir çözüm haline getirir.
YOLOv9, temel amacı kıyaslama testlerinde mutlak maksimum algılama doğruluğuna ulaşmak olan ve entegre bir ekosistem dışında eğitim ve dağıtımın ek karmaşıklıklarını ele almaya hazır olan uzmanlar ve araştırmacılar için mükemmel bir modeldir.
Diğer Modelleri İnceleyin
Nesne algılama dünyası sürekli olarak gelişmektedir. YOLO11 ve YOLOv9'un yanı sıra, Ultralytics ekosistemi içinde bulunan diğer güçlü modellerle de ilgilenebilirsiniz. Projeniz için mükemmel olanı bulmak için YOLOv10, önceki sürüm YOLOv8 ve transformer tabanlı RT-DETR karşılaştırmalarımıza göz atın.