Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 ve YOLOv9#

Gerçek zamanlı nesne algılamanın evrimi; daha iyi doğruluk, daha düşük gecikme süresi ve geliştirilmiş donanım kullanımı için sürekli bir çaba ile karakterize edilmiştir. Bu yolculuktaki iki önemli dönüm noktası Ultralytics YOLOv8 ve YOLOv9 modelleridir. Her iki model de bilgisayarlı görü alanındaki en ileri düzey yetenekleri temsil etse de farklı dağıtım ihtiyaçlarına, mimari felsefelere ve geliştirici ekosistemlerine hitap ederler.

Bu kapsamlı rehber, bir sonraki yapay zeka projeniz için doğru modeli seçmenize yardımcı olmak amacıyla teknik farklılıkları, mimari yenilikleri ve pratik dağıtım hususlarını detaylandırır.

Link to this sectionModel Soy ağacı ve Temel Felsefeler#

Metriklerin derinliklerine inmeden önce, her modelin arkasındaki kökenleri ve birincil tasarım hedeflerini anlamak çok önemlidir.

Link to this sectionUltralytics YOLOv8: Çok Yönlü Ekosistem Standardı#

Ultralytics ekibi tarafından yayınlanan YOLOv8, sadece bağımsız bir nesne algılayıcı olarak değil, aynı zamanda birleşik, çok görevli bir çerçeve olarak tasarlanmıştır. Sorunsuz bir geliştirici deneyimini, düşük bellek gereksinimlerini ve geniş donanım uyumluluğunu ön planda tutar.

YOLOv8 hakkında daha fazla bilgi edinin

Link to this sectionYOLOv9: Programlanabilir Gradyan Bilgisi#

Academia Sinica'daki araştırmacılar tarafından bağımsız olarak geliştirilen YOLOv9, derin sinir ağlarındaki bilgi darboğazı fenomenini özel olarak ele alarak mimari teoriye büyük ölçüde odaklanır.

  • Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
  • Kuruluş: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
  • Tarih: 2024-02-21
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

YOLOv9 hakkında daha fazla bilgi edin

Kurumsal Dağıtım

Büyük ölçekli bir ticari dağıtım planlıyorsan, basitleştirilmiş bulut eğitimi, veri kümesi yönetimi ve tek tıkla API uç noktaları için Ultralytics Platform kullanmayı düşünebilirsin.

Link to this sectionMimari Derinlemesine İnceleme#

Derin öğrenmedeki mimari tercihler, bir modelin ne kadar verimli öğrendiğini ve NVIDIA Jetson veya Intel CPU gibi hedef donanımlarda ne kadar hızlı çalıştığını belirler.

Link to this sectionYOLOv8 Mimarisi: C2f ve Ayrıştırılmış Başlıklar#

YOLOv8, eski C3 modülünün yerini alan C2f modülünü (iki konvolüsyonlu Çapraz Aşamalı Kısmi darboğaz) tanıttı. Bu değişiklik, gradyan akışını iyileştirir ve ağın GPU belleğini ağır bir şekilde zorlamadan daha zengin özellik temsilleri öğrenmesini sağlar.

Ayrıca YOLOv8, çapasız (anchor-free) bir tasarım ile ayrıştırılmış bir başlık (decoupled head) kullanır. Nesnelik, sınıflandırma ve regresyon işlemlerini ayrı yollarla işleyerek model, eğitim sırasında daha hızlı yakınsar ve çeşitli özel veri kümelerine daha iyi genelleme yapar.

Link to this sectionYOLOv9 Mimarisi: PGI ve GELAN#

YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) teknolojilerini tanıtır. PGI, verinin ağ katmanlarından geçerken kaybolmamasını sağlayarak ağırlık güncellemeleri için güvenilir gradyanlar sunar. GELAN, parametre verimliliğini maksimize ederek FLOP'ları yönetilebilir seviyede tutarken yüksek doğruluk elde etmeye çalışır.

Matematiksel olarak etkileyici olsa da, YOLOv9'un eğitim sırasında belirli yardımcı tersine çevrilebilir dallara olan bağımlılığı, eğitim kodunun standart hatlara kıyasla özelleştirilmesini daha karmaşık hale getirebilir.

Link to this sectionPerformans Metrikleri ve Kıyaslamalar#

Aşağıdaki tablo, modellerin farklı boyutlardaki doğrudan bir karşılaştırmasını sunar. Performans, nesne algılama için standart bir kıyaslama olan MS COCO veri kümesi üzerinde ölçülmüştür.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Not: Her sütundaki en iyi değerler kalın olarak vurgulanmıştır.

Link to this sectionÖdünleşimleri Analiz Etmek#

YOLOv9, özellikle daha büyük e varyantı ile biraz daha yüksek tepe doğruluğu (mAP) elde eder. Ancak bu bir bedel gerektirir. Ultralytics YOLOv8, özellikle TensorRT veya ONNX gibi formatlara derlendiğinde çıkarım hızında önemli bir avantaj sağlar. Raspberry Pi veya eski mobil çipler gibi kısıtlı uç donanımlarda yüksek kare hızı (FPS) gerektiren uygulamalar için, YOLOv8'in n ve s varyantları çok daha pratik bir performans dengesi sunar.

Link to this sectionEğitim Verimliliği ve Ekosistem Entegrasyonu#

Bir model seçmek, sadece doğruluk tablolarına bakmaktan daha fazlasını gerektirir; geliştirici deneyimi son derece önemlidir.

Link to this sectionUltralytics Avantajı: Kullanım Kolaylığı#

YOLOv9 eğitimi genellikle karmaşık GitHub depolarını klonlamayı, PyTorch ortamlarını dikkatlice yönetmeyi ve yardımcı kayıp ağırlıklarını manuel olarak yapılandırmayı gerektirir.

Buna karşılık Ultralytics YOLOv8, son derece akıcı bir Python API ile desteklenir. Kullanım kolaylığı için tasarlanmış olup; veri artırma, Weights & Biases ve Comet ML gibi araçlara günlük kaydı ve donanım dağıtımını yerel olarak yönetir.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)

# Export for edge deployment
model.export(format="engine", quantize=16)  # TensorRT export

Bu tek API, prototipten üretime geçiş süresini önemli ölçüde kısaltır. Ayrıca YOLOv8, eğitim sırasında genellikle daha düşük CUDA belleği gerektirir, bu da geliştiricilerin tüketici sınıfı donanımlarda daha büyük yığın boyutları kullanmasına olanak tanır.

Link to this sectionGörev Çok Yönlülüğü#

YOLOv9 mükemmel bir sınırlayıcı kutu (bounding box) algılayıcısı olsa da, gerçek dünya yapay zeka vizyonu daha fazlasını gerektirir. YOLOv8, Örnek Segmentasyonu, Poz Tahmini, Görüntü Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) özelliklerini yerel olarak destekleyen çok yönlü bir güç merkezidir. Birden fazla görev için tek bir çerçeve kullanmak, yazılım şişkinliğini ve bakım yükünü ciddi oranda azaltır.

Geleceğe Bakış

Yeni bir projeye başlıyorsan, uçtan uca NMS içermeyen tasarımları yerel olarak sunan Ultralytics YOLO11 veya en son teknoloji YOLO26 modellerini de değerlendirmek isteyebilirsin.

Link to this sectionGerçek Dünya Kullanım Durumları#

Bu modeller üretim ortamlarında nasıl performans gösterir?

Link to this sectionOtonom Drone'lar ve Robotik#

Hızlı engel kaçınma gerektiren robotik uygulamalar için YOLOv8 tercih edilen seçenektir. YOLOv8n modelinin ultra düşük gecikme süresi, otonom sistemlerin çevrelerine gerçek zamanlı tepki vermesini sağlayarak çarpışmaları önler. OpenVINO ve CoreML'e yerel dışa aktarma yetenekleri, ticari drone'larda yaygın olan düşük güç tüketen çipler üzerinde dağıtımı kolaylaştırır.

Link to this sectionYüksek Çözünürlüklü Hata Algılama#

Mikroskobik anormallikleri tespit etmenin kritik olduğu ve çevrimdışı işlemenin kabul edilebilir olduğu özel üretim ortamlarında, YOLOv9 oldukça etkili olabilir. PGI mimarisi, ağın saç teli kadar ince çatlakları veya PCB lehim hatalarını tanımlamak için gerekli olan ince görsel ayrıntıları korumasına yardımcı olur.

Link to this sectionAkıllı Perakende ve Güvenlik Analitiği#

Müşterileri mağaza reyonlarında takip etmek veya otomatik ödeme sistemlerini yönetmek için YOLOv8 en iyi dengeyi sağlar. BoT-SORT gibi standart algoritmaları kullanarak aynı anda algılama ve çoklu nesne takibi yapabilme yeteneği, onu çok kameralı perakende dağıtımları için sağlam bir çözüm haline getirir.

Link to this sectionKullanım Durumları ve Öneriler#

YOLOv8 ve YOLOv9 arasında seçim yapmak; projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionYOLOv8 Ne Zaman Seçilmeli#

YOLOv8 şunlar için güçlü bir tercihtir:

  • Çok Yönlü Çoklu Görev Dağıtımı: Ultralytics ekosistemi içinde algılama, segmentasyon, sınıflandırma ve poz tahmini için kanıtlanmış bir modele ihtiyaç duyan projeler.
  • Yerleşik Üretim Sistemleri: Halihazırda YOLOv8 mimarisi üzerine kurulu, istikrarlı ve iyi test edilmiş dağıtım hatlarına sahip mevcut üretim ortamları.
  • Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından yararlanan uygulamalar.

Link to this sectionNe Zaman YOLOv9 Seçilmeli#

YOLOv9 şunlar için önerilir:

  • Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
  • Gradyan Akışı Optimizasyonu Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlamaya ve azaltmaya odaklanan araştırmalar.
  • Yüksek Doğrulukta Algılama Kıyaslaması: YOLOv9'un güçlü COCO karşılaştırma performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionBir Sonraki Evrim: YOLO26#

YOLOv8 ve YOLOv9 güçlü olsalar da yapay zeka dünyası hızla ilerliyor. Mutlak en iyi performansı talep eden ekipler için, yeni çıkan YOLO26 bu önceki nesillerin başarıları üzerine inşa edilmiştir.

YOLO26, karmaşık işlem sonrası darboğazlarını tamamen ortadan kaldıran uçtan uca NMS içermeyen bir tasarım sunarak dağıtımı daha basit ve gecikme süresini daha öngörülebilir hale getirir. Yeni MuSGD Optimize Edici ve geliştirilmiş ProgLoss + STAL kayıp fonksiyonları ile desteklenen model, DFL Kaldırma (basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güç cihazı uyumluluğu için Distribution Focal Loss kaldırılmıştır) sayesinde, küçük nesne tanımayı iyileştirirken %43'e kadar daha hızlı CPU çıkarımı sağlar. Uç bilişim sınırlarını zorlayan geliştiricilerin YOLO26 modelini değerlendirmeleri şiddetle tavsiye edilir.

Özetle, YOLOv9 büyüleyici bir mimari araştırma ve mükemmel bir tepe doğruluğu sunsa da, Ultralytics YOLOv8 güvenilir yazılımları hızlı bir şekilde sunmayı amaçlayan bilgisayarlı görü mühendislerinin büyük çoğunluğu için en pratik, en iyi desteklenen ve en çok yönlü seçim olmaya devam etmektedir.

Yorumlar