Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 Dağıtım Seçeneklerinin Karşılaştırmalı Analizi#

YOLO26, PyTorch ve ONNX formatından TensorRT, OpenVINO, CoreML ve özel edge-NPU formatlarına kadar her biri farklı bir çalışma zamanı, donanım hedefi veya platform için ayarlanmış 20'den fazla dağıtım seçeneğini destekler. Doğru seçimi yapmak; çıkarım hızı, donanım kısıtlamaları ve entegrasyon kolaylığı arasında denge kurmanı sağlar. Bu kılavuz, uygulaman için en uygun olanı seçebilmen için tüm seçenekleri karşılaştırır; ardından güvenilir bir şekilde dağıtmak için model dağıtım en iyi uygulamalarına geçebilirsin.



Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀

Dağıtım, bilgisayarlı görü proje iş akışındaki eğitilmiş bir modelin gerçek işleri yapmaya başladığı aşamadır, bu nedenle dışa aktardığın format hız, maliyet ve taşınabilirlik üzerinde doğrudan etkiye sahiptir.

Link to this sectionYOLO26 Modelin İçin Doğru Dağıtım Seçeneği Nasıl Seçilir#

YOLO26 modelini dağıtma zamanı geldiğinde, uygun bir dışa aktarma formatı seçmek çok önemlidir. Ultralytics YOLO26 dışa aktarma belgelerinde belirtildiği gibi, model.export() işlevi, eğitilmiş modelini çeşitli ortamlar ve performans gereksinimleri için özel olarak hazırlanmış çeşitli formatlara dönüştürür.

İdeal format, modelinin hedeflenen operasyonel bağlamına ve donanımına bağlıdır.

Manuel dışa aktarmayı atla

Manuel dışa aktarma olmadan yönetilen bir dağıtım için Ultralytics Platform, 43 küresel bölgede otomatik ölçeklendirme ile kullanıma hazır çıkarım uç noktaları sağlar.

Link to this sectionYOLO26'nın Dağıtım Seçenekleri#

Burada her formatın kısa bir açıklaması ve ne zaman tercih edileceği yer almaktadır. Dışa aktarma işleminin tamamı için dışa aktarma belgelerine bak; yan yana kriterler için karşılaştırma tablosuna git.

  • PyTorch (.pt): Maksimum esneklik ve CUDA GPU hızlandırması sunan, hiçbir dışa aktarma adımı gerektirmeyen araştırma ve prototip oluşturma için ideal olan yerel eğitim ve çıkarım formatıdır.
  • TorchScript (torchscript): Modeli, Python'ın bulunmadığı üretim sistemleri için Python içermeyen bir C++ çalışma zamanına göre serileştirir.
  • ONNX (onnx): ONNX Runtime aracılığıyla geniş çaplı platformlar arası ve donanım desteğine sahip, çerçeveden bağımsız bir değişim formatıdır.
  • OpenVINO (openvino): Intel'in IoT ve uç bilişim alanlarında yaygın olan Intel CPU'lar, entegre GPU'lar ve NPU'lar üzerinde optimize edilmiş çıkarım için geliştirdiği araç takımıdır.
  • TensorRT (engine): FP16 ve INT8 optimizasyonu ile en üst düzeyde GPU çıkarımı sağlayan NVIDIA'nın yüksek performanslı çalışma zamanıdır.
  • CoreML (coreml): Apple'ın Apple Neural Engine'i kullanan iOS, macOS, watchOS ve tvOS için cihaz üstü formatıdır.
  • TF SavedModel (saved_model): TensorFlow Serving ile ölçeklenebilir sunucu tarafı sunumu için TensorFlow'un standart formatıdır.
  • TF GraphDef (pb): Sabit bir hesaplama grafiğine ihtiyaç duyan ortamlar için dondurulmuş statik grafikli bir TensorFlow formatıdır.
  • TF Lite (tflite): Mobil ve gömülü donanımlar üzerinde cihaz üstü çıkarım için hafif bir TensorFlow çalışma zamanıdır.
  • TF Edge TPU (edgetpu): TF Lite modellerini Google Coral Edge TPU hızlandırıcıları için derler.
  • TF.js (tfjs): Modelleri WebGL aracılığıyla hızlandırarak, arka uç olmadan doğrudan tarayıcıda çalıştırır.
  • PaddlePaddle (paddle): Baidu'nun Çin'de popüler olan ve geniş donanım desteği sunan derin öğrenme çerçevesidir.
  • MNN (mnn): Mobil ve gömülü ARM ve x86-64 sistemleri için optimize edilmiş hafif, yüksek performanslı bir çıkarım motorudur.
  • NCNN (ncnn): Mobil ARM cihazları için ayarlanmış yüksek performanslı, hafif bir çıkarım çerçevesidir.
  • Sony IMX500 (imx): Raspberry Pi AI Camera gibi çip üzerinde işlemeye sahip Sony'nin IMX500 akıllı görüntü sensörü için dışa aktarmalar sağlar.
  • Rockchip RKNN (rknn): FP16 ve INT8 kuantizasyonu ile gömülü kartlardaki Rockchip NPU'larını hedefler.
  • ExecuTorch (executorch): PyTorch'un XNNPACK aracılığıyla mobil (iOS ve Android) ve gömülü sistemler için yerel cihaz üstü çalışma zamanıdır.
  • Axelera AI (axelera): Yüksek verimli uç çıkarımı için PCIe veya M.2 üzerinden Axelera'nın Metis AIPU'su (856 TOPS'a kadar) için derleme yapar.
  • DEEPX (deepx): Gömülü uç çıkarımı için INT8 kuantizasyonu ile DEEPX NPU donanımını hedefler.
  • Qualcomm QNN (qnn): Qualcomm AI yığını aracılığıyla Snapdragon Hexagon NPU, Adreno GPU ve CPU üzerinde cihaz üstü çıkarım sağlar.

Ek bir uç hedefi için, Hailo entegrasyonu YOLO algılama modellerini Hailo HEF formatına derler. Bu doğrudan bir model.export() hedefi değildir: algılama modelleri önce ONNX'e aktarılır, ardından Hailo-8, Hailo-8L ve Hailo-15 hızlandırıcıları için harici Hailo Dataflow Compiler ile HEF'e derlenir.

Link to this sectionDağıtım Seçenekleri Karşılaştırması#

Aşağıdaki tablo, YOLO26 modelleri için dağıtım seçeneklerini genellikle seçimi yönlendiren kriterlere göre özetlemektedir. Her formata derinlemesine bir bakış için dışa aktarma formatları belgelerine bak.

Dağıtım SeçeneğiPerformans KarşılaştırmalarıUyumluluk ve EntegrasyonTopluluk Desteği ve EkosistemÖrnek OlaylarBakım ve GüncellemelerGüvenlik HususlarıDonanım Hızlandırma
PyTorchİyi esneklik; ham performanstan ödün verebilirPython kütüphaneleriyle mükemmelKapsamlı kaynaklar ve toplulukAraştırma ve prototiplerDüzenli, aktif geliştirmeDağıtım ortamına bağlıGPU hızlandırma için CUDA desteği
TorchScriptÜretim için PyTorch'tan daha iyiPyTorch'tan C++'a sorunsuz geçişÖzelleşmiş ancak PyTorch'tan daha darPython'ın darboğaz olduğu endüstriPyTorch ile tutarlı güncellemelerTam Python olmadan gelişmiş güvenlikCUDA desteğini PyTorch'tan devralır
ONNXÇalışma zamanına bağlı olarak değişkenFarklı çerçeveler arasında yüksekGeniş ekosistem, birçok kuruluş tarafından destekleniyorML çerçeveleri arasında esneklikYeni işlemler için düzenli güncellemelerGüvenli dönüştürme ve dağıtım uygulamaları sağlaÇeşitli donanım optimizasyonları
OpenVINOIntel donanımı için optimize edilmiştirIntel ekosistemi içinde en iyisiBilgisayarlı görme alanında sağlamIntel donanımı ile IoT ve uçIntel donanımı için düzenli güncellemelerHassas uygulamalar için sağlam özelliklerIntel donanımı için özel olarak hazırlanmıştır
TensorRTNVIDIA GPU'larında üst düzeyNVIDIA donanımı için en iyisiNVIDIA aracılığıyla güçlü ağGerçek zamanlı video ve görüntü çıkarımıYeni GPU'lar için sık güncellemelerGüvenliğe vurguNVIDIA GPU'ları için tasarlandı
CoreMLCihaz üzerinde Apple donanımı için optimize edilmiştirApple ekosistemine özelGüçlü Apple ve geliştirici desteğiApple ürünlerinde cihaz üzerinde MLDüzenli Apple güncellemeleriGizlilik ve güvenliğe odaklanApple sinir motoru ve GPU
TF SavedModelSunucu ortamlarında ölçeklenebilirTensorFlow ekosisteminde geniş uyumlulukTensorFlow popülaritesi nedeniyle büyük destekModelleri ölçekli bir şekilde sunmaGoogle ve topluluk tarafından düzenli güncellemelerKurumsal için sağlam özelliklerÇeşitli donanım hızlandırmaları
TF GraphDefStatik hesaplama grafikleri için kararlıTensorFlow altyapısı ile iyi entegre olurStatik grafikleri optimize etmek için kaynaklarStatik grafik gerektiren senaryolarTensorFlow çekirdeği ile eş zamanlı güncellemelerYerleşik TensorFlow güvenlik uygulamalarıTensorFlow hızlandırma seçenekleri
TF LiteMobil/gömülü cihazlarda hız ve verimlilikGeniş cihaz desteği yelpazesiGüçlü topluluk, Google destekliMinimal ayak izine sahip mobil uygulamalarMobil için en son özelliklerSon kullanıcı cihazlarında güvenli ortamDiğerlerinin yanı sıra GPU ve DSP
TF Edge TPUGoogle'ın Edge TPU donanımı için optimize edilmiştirEdge TPU cihazlarına özelGoogle ve üçüncü taraf kaynaklarla büyümeGerçek zamanlı işleme gerektiren IoT cihazlarıYeni Edge TPU donanımı için iyileştirmelerGoogle'ın sağlam IoT güvenliğiGoogle Coral için özel tasarlanmış
TF.jsTarayıcı içinde makul performansWeb teknolojileri ile yüksekWeb ve Node.js geliştiricileri desteğiEtkileşimli web uygulamalarıTensorFlow ekibi ve topluluk katkılarıWeb platformu güvenlik modeliWebGL ve diğer API'ler ile geliştirilmiş
PaddlePaddleRekabetçi, kullanımı kolay ve ölçeklenebilirBaidu ekosistemi, geniş uygulama desteğiHızla büyüyor, özellikle Çin'deÇin pazarı ve dil işlemeÇinli yapay zeka uygulamalarına odaklanmaVeri gizliliğini ve güvenliğini vurgularBaidu'nun Kunlun çiplerini içerir
MNNMobil cihazlar için yüksek performansMobil ve gömülü ARM sistemleri ve X86-64 CPUMobil/gömülü ML topluluğuMobil sistemler verimliliğiMobil cihazlarda yüksek performans bakımıCihaz üzerinde güvenlik avantajlarıARM CPU'ları ve GPU'ları optimizasyonları
NCNNMobil ARM tabanlı cihazlar için optimize edilmiştirMobil ve gömülü ARM sistemleriNiş ancak aktif mobil/gömülü ML topluluğuAndroid ve ARM sistemleri verimliliğiARM üzerinde yüksek performans bakımıCihaz üzerinde güvenlik avantajlarıARM CPU'ları ve GPU'ları optimizasyonları
Sony IMX500Çok düşük güçte sensör üstü çıkarımSony IMX500 sensörü, Raspberry Pi AI CameraSony AITRIOS ekosistemiKamera üstü uç yapay zekaSony SDK ve MCT araç zinciri güncellemeleriVeri sensör üzerinde kalırSony IMX500 çip üstü hızlandırıcı
Rockchip RKNNRockchip NPU'ları için optimize edilmiştirRockchip SoC kartları (ör. RK3588)Rockchip geliştirici topluluğuGömülü SBC ve uç cihazlarRockchip RKNN-Toolkit güncellemeleriCihaz üstü yerel çıkarımRockchip NPU
ExecuTorchVerimli cihaz üstü PyTorch çalışma zamanıiOS, Android, XNNPACK aracılığıyla gömülüPyTorch projesi tarafından desteklenmektedirMobil ve gömülü uygulamalarPyTorch ile birlikte korunmaktadırCihaz üzerinde çıkarım, veriyi yerel tutarXNNPACK ve mobil CPU/GPU arka uçları
Axelera AIÇok yüksek verim (856 TOPS'a kadar)PCIe veya M.2 üzerinden Metis AIPUAxelera Voyager SDKYüksek verimli uç çıkarımıAxelera SDK güncellemeleriŞirket içi uç çıkarımıAxelera Metis AIPU
DEEPXINT8 optimize edilmiş NPU çıkarımıDEEPX NPU donanımıDEEPX geliştirici araçları (dx_com, dx_engine)Gömülü uç çıkarımıDEEPX SDK ve çalışma zamanı güncellemeleriCihaz üstü yerel çıkarımDEEPX NPU
Qualcomm QNNHızlı cihaz üstü Snapdragon çıkarımıSnapdragon Hexagon NPU, Adreno GPU, CPUQualcomm AI Hub ekosistemiMobil ve uç Snapdragon cihazlarıQualcomm AI yığını (QAIRT) güncellemeleriCihaz üzerinde çıkarım, veriyi yerel tutarSnapdragon Hexagon NPU

Bu karşılaştırma sana üst düzey bir genel bakış sunar. Dağıtım için projenin özel gereksinimlerini ve kısıtlamalarını her seçeneğe göre tart ve seçtiğin format için bağlantılı entegrasyon kılavuzuna başvur.

Link to this sectionSonuç#

YOLO26'nın geniş dışa aktarma formatı yelpazesi, bulut GPU sunucusundan sensör üstü uç kameraya kadar bir modeli neredeyse her ortama göre uyarlamanı sağlar. Bir format seçtikten sonra, optimizasyon, sorun giderme ve güvenlik için model dağıtım en iyi uygulamalarını takip et ve bir sorunla karşılaştığında Ultralytics topluluğundan destek al.

Link to this sectionSSS#

Link to this sectionFarklı donanım platformlarında YOLO26 için mevcut dağıtım seçenekleri nelerdir?#

Ultralytics YOLO26, her biri belirli ortamlar ve donanım platformları için tasarlanmış çeşitli dağıtım formatlarını destekler. Temel formatlar şunlardır:

  • Mükemmel Python entegrasyonu ile araştırma ve prototipleme için PyTorch.
  • Python'un mevcut olmadığı üretim ortamları için TorchScript.
  • Platformlar arası uyumluluk ve donanım hızlandırma için ONNX.
  • Intel donanımında optimize edilmiş performans için OpenVINO.
  • NVIDIA GPU'larında yüksek hızlı çıkarım için TensorRT.

Her formatın kendine özgü avantajları vardır. Ayrıntılı bir anlatım için dışa aktarma süreci dokümantasyonumuza bakın.

Link to this sectionBir Intel CPU üzerinde YOLO26 modelimin çıkarım hızını nasıl artırabilirim?#

Intel CPU'larında çıkarım hızını artırmak için YOLO26 modelini Intel'in OpenVINO araç setini kullanarak dağıtabilirsin. OpenVINO, modelleri Intel donanımından verimli bir şekilde yararlanacak şekilde optimize ederek önemli performans artışları sunar.

  1. YOLO26 modelini model.export() işlevini kullanarak OpenVINO formatına dönüştür.
  2. Intel OpenVINO Dışa Aktarma dokümantasyonundaki ayrıntılı kurulum kılavuzunu izle.

Daha fazla bilgi için blog yazımıza göz at.

Link to this sectionYOLO26 modellerini mobil cihazlara dağıtabilir miyim?#

Evet, YOLO26 modelleri, hem Android hem de iOS platformları için TensorFlow Lite (TF Lite) kullanılarak mobil cihazlara dağıtılabilir. TF Lite, mobil ve gömülü cihazlar için tasarlanmıştır ve cihaz üzerinde verimli çıkarım sağlar.

Örnek
# Export command for TFLite format
model.export(format="tflite")

Modelleri mobile dağıtma hakkında daha fazla ayrıntı için TF Lite entegrasyon kılavuzumuza başvur.

Link to this sectionYOLO26 modelim için bir dağıtım formatı seçerken hangi faktörleri göz önünde bulundurmalıyım?#

YOLO26 için bir dağıtım formatı seçerken şu faktörleri göz önünde bulundur:

  • Performans: TensorRT gibi bazı formatlar NVIDIA GPU'larında olağanüstü hızlar sağlarken, OpenVINO Intel donanımı için optimize edilmiştir.
  • Uyumluluk: ONNX, farklı platformlar arasında geniş uyumluluk sunar.
  • Entegrasyon Kolaylığı: CoreML veya TF Lite gibi formatlar sırasıyla iOS ve Android gibi belirli ekosistemler için özel olarak hazırlanmıştır.
  • Topluluk Desteği: PyTorch ve TensorFlow gibi formatlar kapsamlı topluluk kaynaklarına ve desteğine sahiptir.

Karşılaştırmalı bir analiz için dışa aktarma formatları dokümantasyonumuza başvur.

Link to this sectionYOLO26 modellerini bir web uygulamasında nasıl dağıtabilirim?#

YOLO26 modellerini bir web uygulamasında dağıtmak için, makine öğrenimi modellerini doğrudan tarayıcıda çalıştırmaya olanak tanıyan TensorFlow.js (TF.js) kullanabilirsin. Bu yaklaşım, arka uç altyapısına olan ihtiyacı ortadan kaldırır ve gerçek zamanlı performans sağlar.

  1. YOLO26 modelini TF.js formatına dışa aktar.
  2. Dışa aktarılan modeli web uygulamana entegre et.

Adım adım talimatlar için TensorFlow.js entegrasyonu hakkındaki kılavuzumuza başvur.

Yorumlar