Analisi comparativa delle opzioni di deployment per YOLO26

Introduzione

Hai fatto molta strada nel tuo percorso con YOLO26. Hai raccolto dati diligentemente, li hai annotati meticolosamente e hai dedicato ore ad addestrare e valutare rigorosamente il tuo modello YOLO26 personalizzato. Ora è il momento di mettere il tuo modello al lavoro per la tua specifica applicazione, caso d'uso o progetto. Ma c'è una decisione fondamentale che ti attende: come esportare e distribuire il tuo modello in modo efficace.



Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀

Questa guida ti accompagna tra le opzioni di deployment di YOLO26 e i fattori essenziali da considerare per scegliere l'opzione giusta per il tuo progetto.

Come selezionare l'opzione di deployment corretta per il tuo modello YOLO26

Quando arriva il momento di distribuire il tuo modello YOLO26, selezionare un formato di esportazione adatto è molto importante. Come descritto nella documentazione sulle modalità di Ultralytics YOLO26, la funzione model.export() ti permette di convertire il tuo modello addestrato in una varietà di formati su misura per diversi ambienti e requisiti di prestazioni.

Il formato ideale dipende dal contesto operativo previsto per il tuo modello, bilanciando velocità, vincoli hardware e facilità di integrazione. Per un deployment gestito senza esportazione manuale, Ultralytics Platform fornisce endpoint di inferenza pronti all'uso con scalabilità automatica in 43 regioni globali. Nella sezione seguente, esamineremo più da vicino ogni opzione di esportazione, capendo quando scegliere ciascuna di esse.

Opzioni di deployment di YOLO26

Esaminiamo le diverse opzioni di deployment di YOLO26. Per una guida dettagliata del processo di esportazione, visita la pagina della documentazione di Ultralytics sull'esportazione.

PyTorch

PyTorch è una libreria di machine learning open-source ampiamente utilizzata per applicazioni di deep learning e intelligenza artificiale. Offre un alto livello di flessibilità e velocità, il che l'ha resa una delle preferite tra ricercatori e sviluppatori.

  • Benchmark delle prestazioni: PyTorch è noto per la sua facilità d'uso e flessibilità, il che potrebbe comportare un leggero compromesso nelle prestazioni pure rispetto ad altri framework più specializzati e ottimizzati.
  • Compatibilità e integrazione: Offre un'eccellente compatibilità con varie librerie di data science e machine learning in Python.
  • Supporto della community ed ecosistema: Una delle community più vivaci, con risorse estese per l'apprendimento e la risoluzione dei problemi.
  • Casi studio: Comunemente usato nei prototipi di ricerca, molti documenti accademici fanno riferimento a modelli distribuiti in PyTorch.
  • Manutenzione e aggiornamenti: Aggiornamenti regolari con sviluppo attivo e supporto per nuove funzionalità.
  • Considerazioni sulla sicurezza: Patch regolari per problemi di sicurezza, ma la sicurezza dipende in gran parte dall'ambiente complessivo in cui viene distribuito.
  • Accelerazione hardware: Supporta CUDA per l'accelerazione GPU, essenziale per velocizzare l'addestramento del modello e l'inferenza.

TorchScript

TorchScript estende le capacità di PyTorch consentendo l'esportazione di modelli da eseguire in un ambiente runtime C++. Questo lo rende adatto per ambienti di produzione in cui Python non è disponibile.

  • Benchmark delle prestazioni: Può offrire prestazioni migliorate rispetto al PyTorch nativo, specialmente in ambienti di produzione.
  • Compatibilità e integrazione: Progettato per una transizione senza problemi da PyTorch ad ambienti di produzione C++, sebbene alcune funzionalità avanzate potrebbero non tradursi perfettamente.
  • Supporto della community ed ecosistema: Beneficia della vasta community di PyTorch ma ha un ambito più ristretto di sviluppatori specializzati.
  • Casi studio: Ampiamente utilizzato in contesti industriali dove il sovraccarico di prestazioni di Python è un collo di bottiglia.
  • Manutenzione e aggiornamenti: Mantenuto insieme a PyTorch con aggiornamenti coerenti.
  • Considerazioni sulla sicurezza: Offre una sicurezza migliorata consentendo l'esecuzione di modelli in ambienti senza installazioni Python complete.
  • Accelerazione hardware: Eredita il supporto CUDA di PyTorch, garantendo un utilizzo efficiente della GPU.

ONNX

Open Neural Network Exchange (ONNX) è un formato che consente l'interoperabilità dei modelli tra diversi framework, il che può essere fondamentale durante la distribuzione su varie piattaforme.

  • Benchmark delle prestazioni: I modelli ONNX possono subire prestazioni variabili a seconda del runtime specifico su cui vengono distribuiti.
  • Compatibilità e integrazione: Alta interoperabilità tra piattaforme e hardware multipli grazie alla sua natura indipendente dal framework.
  • Supporto della community ed ecosistema: Supportato da molte organizzazioni, portando a un ampio ecosistema e a una varietà di strumenti per l'ottimizzazione.
  • Casi studio: Frequentemente utilizzato per spostare modelli tra diversi framework di machine learning, dimostrando la sua flessibilità.
  • Manutenzione e aggiornamenti: Come standard aperto, ONNX viene regolarmente aggiornato per supportare nuove operazioni e modelli.
  • Considerazioni sulla sicurezza: Come con qualsiasi strumento multipiattaforma, è essenziale garantire pratiche sicure nella pipeline di conversione e distribuzione.
  • Accelerazione hardware: Con ONNX Runtime, i modelli possono sfruttare varie ottimizzazioni hardware.

OpenVINO

OpenVINO è un toolkit di Intel progettato per facilitare la distribuzione di modelli di deep learning su hardware Intel, migliorando prestazioni e velocità.

  • Benchmark delle prestazioni: Specificamente ottimizzato per CPU, GPU e VPU Intel, offrendo significativi incrementi di prestazioni su hardware compatibile.
  • Compatibilità e integrazione: Funziona al meglio all'interno dell'ecosistema Intel ma supporta anche una gamma di altre piattaforme.
  • Supporto della community ed ecosistema: Supportato da Intel, con una solida base di utenti specialmente nel dominio della computer vision.
  • Casi studio: Spesso utilizzato in scenari IoT e edge computing in cui l'hardware Intel è prevalente.
  • Manutenzione e aggiornamenti: Intel aggiorna regolarmente OpenVINO per supportare i modelli di deep learning più recenti e l'hardware Intel.
  • Considerazioni sulla sicurezza: Fornisce robuste funzionalità di sicurezza adatte alla distribuzione in applicazioni sensibili.
  • Accelerazione hardware: Su misura per l'accelerazione su hardware Intel, sfruttando set di istruzioni dedicati e funzionalità hardware.

Per ulteriori dettagli sulla distribuzione utilizzando OpenVINO, fai riferimento alla documentazione di integrazione di Ultralytics: Esportazione Intel OpenVINO.

TensorRT

TensorRT è un ottimizzatore e runtime di inferenza di deep learning ad alte prestazioni di NVIDIA, ideale per applicazioni che necessitano di velocità ed efficienza.

  • Benchmark delle prestazioni: Offre prestazioni di alto livello su GPU NVIDIA con supporto per l'inferenza ad alta velocità.
  • Compatibilità e integrazione: Più adatto per l'hardware NVIDIA, con supporto limitato al di fuori di questo ambiente.
  • Supporto della community ed ecosistema: Forte rete di supporto attraverso i forum degli sviluppatori e la documentazione di NVIDIA.
  • Casi studio: Ampiamente adottato in settori che richiedono inferenza in tempo reale su dati video e immagine.
  • Manutenzione e aggiornamenti: NVIDIA mantiene TensorRT con aggiornamenti frequenti per migliorare le prestazioni e supportare nuove architetture GPU.
  • Considerazioni sulla sicurezza: Come molti prodotti NVIDIA, ha una forte enfasi sulla sicurezza, ma le specifiche dipendono dall'ambiente di distribuzione.
  • Accelerazione hardware: Progettato esclusivamente per GPU NVIDIA, fornendo ottimizzazione e accelerazione profonde.

Per ulteriori informazioni sulla distribuzione di TensorRT, dai un'occhiata alla guida all'integrazione di TensorRT.

CoreML

CoreML è il framework di machine learning di Apple, ottimizzato per le prestazioni sul dispositivo nell'ecosistema Apple, inclusi iOS, macOS, watchOS e tvOS.

  • Benchmark delle prestazioni: Ottimizzato per prestazioni on-device su hardware Apple con un consumo minimo della batteria.
  • Compatibilità e integrazione: Esclusivamente per l'ecosistema Apple, fornendo un flusso di lavoro semplificato per applicazioni iOS e macOS.
  • Supporto della community ed ecosistema: Forte supporto da parte di Apple e una community di sviluppatori dedicata, con documentazione e strumenti estesi.
  • Casi studio: Comunemente utilizzato in applicazioni che richiedono capacità di machine learning sul dispositivo su prodotti Apple.
  • Manutenzione e aggiornamenti: Aggiornato regolarmente da Apple per supportare i più recenti progressi nel machine learning e l'hardware Apple.
  • Considerazioni sulla sicurezza: Beneficia dell'attenzione di Apple alla privacy dell'utente e alla sicurezza dei dati.
  • Accelerazione hardware: Sfrutta appieno il neural engine e la GPU di Apple per attività di machine learning accelerate.

TF SavedModel

TF SavedModel è il formato di TensorFlow per salvare e servire modelli di machine learning, particolarmente adatto per ambienti server scalabili.

  • Benchmark delle prestazioni: Offre prestazioni scalabili in ambienti server, specialmente se utilizzato con TensorFlow Serving.
  • Compatibilità e integrazione: Ampia compatibilità nell'ecosistema di TensorFlow, incluse distribuzioni cloud e server enterprise.
  • Supporto della community ed ecosistema: Grande supporto della community grazie alla popolarità di TensorFlow, con una vasta gamma di strumenti per la distribuzione e l'ottimizzazione.
  • Casi studio: Estensivamente utilizzato in ambienti di produzione per servire modelli di deep learning su larga scala.
  • Manutenzione e aggiornamenti: Supportato da Google e dalla community di TensorFlow, garantendo aggiornamenti regolari e nuove funzionalità.
  • Considerazioni sulla sicurezza: La distribuzione utilizzando TensorFlow Serving include robuste funzionalità di sicurezza per applicazioni di livello enterprise.
  • Accelerazione hardware: Supporta varie accelerazioni hardware tramite i backend di TensorFlow.

TF GraphDef

TF GraphDef è un formato TensorFlow che rappresenta il modello come un grafo, il che è utile per ambienti in cui è richiesto un grafo di calcolo statico.

  • Benchmark delle prestazioni: Fornisce prestazioni stabili per grafi di calcolo statici, con un focus su coerenza e affidabilità.
  • Compatibilità e integrazione: Si integra facilmente nell'infrastruttura di TensorFlow ma è meno flessibile rispetto a SavedModel.
  • Supporto della community ed ecosistema: Buono supporto dall'ecosistema di TensorFlow, con molte risorse disponibili per l'ottimizzazione di grafi statici.
  • Casi studio: Utile in scenari in cui è necessario un grafo statico, come in alcuni sistemi embedded.
  • Manutenzione e aggiornamenti: Aggiornamenti regolari insieme agli aggiornamenti principali di TensorFlow.
  • Considerazioni sulla sicurezza: Garantisce una distribuzione sicura con le consolidate pratiche di sicurezza di TensorFlow.
  • Accelerazione hardware: Può utilizzare le opzioni di accelerazione hardware di TensorFlow, sebbene non sia flessibile come SavedModel.

Scopri di più su TF GraphDef nella nostra guida all'integrazione di TF GraphDef.

TF Lite

TF Lite è la soluzione di TensorFlow per il machine learning su dispositivi mobili ed embedded, fornendo una libreria leggera per l'inferenza on-device.

  • Benchmark delle prestazioni: Progettato per velocità ed efficienza su dispositivi mobili ed embedded.
  • Compatibilità e integrazione: Può essere utilizzato su una vasta gamma di dispositivi grazie alla sua natura leggera.
  • Supporto della community ed ecosistema: Supportato da Google, ha una community robusta e un numero crescente di risorse per gli sviluppatori.
  • Casi studio: Popolare in applicazioni mobili che richiedono inferenza on-device con un ingombro minimo.
  • Manutenzione e aggiornamenti: Aggiornato regolarmente per includere le funzionalità e le ottimizzazioni più recenti per i dispositivi mobili.
  • Considerazioni sulla sicurezza: Fornisce un ambiente sicuro per l'esecuzione di modelli sui dispositivi degli utenti finali.
  • Accelerazione hardware: Supporta una varietà di opzioni di accelerazione hardware, incluse GPU e DSP.

TF Edge TPU

TF Edge TPU è progettato per un calcolo ad alta velocità ed efficiente sull'hardware Edge TPU di Google, perfetto per dispositivi IoT che richiedono elaborazione in tempo reale.

  • Benchmark delle prestazioni: Specificamente ottimizzato per il calcolo ad alta velocità ed efficiente sull'hardware Edge TPU di Google.
  • Compatibilità e integrazione: Funziona esclusivamente con modelli TensorFlow Lite su dispositivi Edge TPU.
  • Supporto della community ed ecosistema: Supporto in crescita con risorse fornite da Google e sviluppatori di terze parti.
  • Casi studio: Utilizzato in dispositivi IoT e applicazioni che richiedono elaborazione in tempo reale con bassa latenza.
  • Manutenzione e aggiornamenti: Migliorato continuamente per sfruttare le capacità delle nuove versioni dell'hardware Edge TPU.
  • Considerazioni sulla sicurezza: Si integra con la robusta sicurezza di Google per dispositivi IoT ed edge.
  • Accelerazione hardware: Progettato su misura per sfruttare appieno i dispositivi Google Coral.

TF.js

TensorFlow.js (TF.js) è una libreria che porta le capacità di machine learning direttamente nel browser, offrendo un nuovo regno di possibilità per sviluppatori web e utenti. Consente l'integrazione di modelli di machine learning in applicazioni web senza la necessità di un'infrastruttura di back-end.

  • Benchmark delle prestazioni: Abilita il machine learning direttamente nel browser con prestazioni ragionevoli, a seconda del dispositivo client.
  • Compatibilità e integrazione: Alta compatibilità con le tecnologie web, consentendo una facile integrazione nelle applicazioni web.
  • Supporto della community ed ecosistema: Supporto da parte di una community di sviluppatori web e Node.js, con una varietà di strumenti per il deployment di modelli ML nei browser.
  • Casi d'uso: Ideale per applicazioni web interattive che traggono vantaggio dal machine learning lato client senza la necessità di elaborazione lato server.
  • Manutenzione e aggiornamenti: Mantenuto dal team di TensorFlow con contributi dalla community open-source.
  • Considerazioni sulla sicurezza: Viene eseguito all'interno del contesto sicuro del browser, utilizzando il modello di sicurezza della piattaforma web.
  • Accelerazione hardware: Le prestazioni possono essere migliorate con API basate sul web che accedono all'accelerazione hardware come WebGL.

PaddlePaddle

PaddlePaddle è un framework di deep learning open-source sviluppato da Baidu. È progettato per essere efficiente per i ricercatori e facile da usare per gli sviluppatori. È particolarmente popolare in Cina e offre supporto specializzato per l'elaborazione della lingua cinese.

  • Benchmark delle prestazioni: Offre prestazioni competitive con un focus sulla facilità d'uso e sulla scalabilità.
  • Compatibilità e integrazione: Ben integrato nell'ecosistema di Baidu e supporta un'ampia gamma di applicazioni.
  • Supporto della community ed ecosistema: Sebbene la community sia più piccola a livello globale, è in rapida crescita, specialmente in Cina.
  • Casi d'uso: Comunemente utilizzato nei mercati cinesi e dagli sviluppatori che cercano alternative ad altri framework principali.
  • Manutenzione e aggiornamenti: Aggiornato regolarmente con un focus sul supporto alle applicazioni e ai servizi AI in lingua cinese.
  • Considerazioni sulla sicurezza: Enfatizza la privacy dei dati e la sicurezza, soddisfacendo gli standard di governance dei dati cinesi.
  • Accelerazione hardware: Supporta varie accelerazioni hardware, inclusi i chip Kunlun proprietari di Baidu.

MNN

MNN è un framework di deep learning altamente efficiente e leggero. Supporta l'inferenza e l'addestramento di modelli di deep learning e vanta prestazioni leader del settore per l'inferenza e l'addestramento on-device. Inoltre, MNN viene utilizzato anche su dispositivi embedded, come IoT.

  • Benchmark delle prestazioni: Elevate prestazioni per dispositivi mobili con un'eccellente ottimizzazione per i sistemi ARM.
  • Compatibilità e integrazione: Funziona bene con sistemi ARM mobili ed embedded e architetture CPU X86-64.
  • Supporto della community ed ecosistema: Supportato dalla community di machine learning mobile ed embedded.
  • Casi d'uso: Ideale per applicazioni che richiedono prestazioni efficienti su sistemi mobili.
  • Manutenzione e aggiornamenti: Regolarmente mantenuto per garantire elevate prestazioni sui dispositivi mobili.
  • Considerazioni sulla sicurezza: Fornisce vantaggi di sicurezza on-device mantenendo i dati in locale.
  • Accelerazione hardware: Ottimizzato per CPU e GPU ARM per la massima efficienza.

NCNN

NCNN è un framework di inferenza per reti neurali ad alte prestazioni ottimizzato per la piattaforma mobile. Si distingue per la sua leggerezza ed efficienza, rendendolo particolarmente adatto a dispositivi mobili ed embedded in cui le risorse sono limitate.

  • Benchmark delle prestazioni: Altamente ottimizzato per piattaforme mobili, offrendo un'inferenza efficiente su dispositivi basati su ARM.
  • Compatibilità e integrazione: Adatto per applicazioni su telefoni cellulari e sistemi embedded con architettura ARM.
  • Supporto della community ed ecosistema: Supportato da una community di nicchia ma attiva focalizzata su applicazioni ML mobili ed embedded.
  • Casi d'uso: Preferito per applicazioni mobili in cui efficienza e velocità sono critiche su Android e altri sistemi basati su ARM.
  • Manutenzione e aggiornamenti: Continuamente migliorato per mantenere elevate prestazioni su una gamma di dispositivi ARM.
  • Considerazioni sulla sicurezza: Si concentra sull'esecuzione in locale sul dispositivo, sfruttando la sicurezza intrinseca dell'elaborazione on-device.
  • Accelerazione hardware: Pensato per CPU e GPU ARM, con ottimizzazioni specifiche per queste architetture.

Analisi comparativa delle opzioni di deployment per YOLO26

La seguente tabella fornisce una panoramica delle varie opzioni di deployment disponibili per i modelli YOLO26, aiutandoti a valutare quale si adatti meglio alle esigenze del tuo progetto in base a diversi criteri critici. Per uno sguardo approfondito al formato di ciascuna opzione di deployment, consulta la pagina della documentazione di Ultralytics sui formati di esportazione.

Opzione di deploymentBenchmark delle prestazioniCompatibilità e integrazioneSupporto della community ed ecosistemaCasi d'usoManutenzione e aggiornamentiConsiderazioni sulla sicurezzaAccelerazione hardware
PyTorchBuona flessibilità; possibile compromesso sulle prestazioni pureEccellente con le librerie PythonRisorse ed ecosistema estesiRicerca e prototipiSviluppo regolare e attivoDipendente dall'ambiente di deploymentSupporto CUDA per accelerazione GPU
TorchScriptMigliore per la produzione rispetto a PyTorchTransizione fluida da PyTorch a C++Specializzato ma più limitato di PyTorchSettore in cui Python rappresenta un collo di bottigliaAggiornamenti coerenti con PyTorchSicurezza migliorata senza Python completoEredita il supporto CUDA da PyTorch
ONNXVariabile a seconda del runtimeAlta tra diversi frameworkEcosistema ampio, supportato da molte organizzazioniFlessibilità tra i framework MLAggiornamenti regolari per nuove operazioniAssicurare pratiche sicure di conversione e deploymentVarie ottimizzazioni hardware
OpenVINOOttimizzato per l'hardware IntelMigliore all'interno dell'ecosistema IntelSolido nel dominio della computer visionIoT ed edge con hardware IntelAggiornamenti regolari per l'hardware IntelFunzionalità robuste per applicazioni sensibiliPensato per l'hardware Intel
TensorRTDi alto livello su GPU NVIDIAMigliore per l'hardware NVIDIAForte network tramite NVIDIAInferenza video e immagine in tempo realeAggiornamenti frequenti per nuove GPUEnfasi sulla sicurezzaProgettato per GPU NVIDIA
CoreMLOttimizzato per hardware Apple on-deviceEsclusivo per l'ecosistema AppleForte supporto Apple e degli sviluppatoriML on-device su prodotti AppleAggiornamenti Apple regolariFocus su privacy e sicurezzaApple neural engine e GPU
TF SavedModelScalabile in ambienti serverAmpia compatibilità nell'ecosistema TensorFlowAmpio supporto grazie alla popolarità di TensorFlowServing di modelli su larga scalaAggiornamenti regolari da parte di Google e della communityFunzionalità robuste per l'enterpriseVarie accelerazioni hardware
TF GraphDefStabile per grafi di calcolo staticiSi integra bene con l'infrastruttura TensorFlowRisorse per l'ottimizzazione di grafi staticiScenari che richiedono grafi staticiAggiornamenti insieme al core di TensorFlowPratiche di sicurezza consolidate di TensorFlowOpzioni di accelerazione TensorFlow
TF LiteVelocità ed efficienza su mobile/embeddedAmpia gamma di supporto dispositiviCommunity robusta, supportata da GoogleApplicazioni mobili con ingombro minimoUltime funzionalità per mobileAmbiente sicuro su dispositivi dell'utente finaleGPU e DSP tra gli altri
TF Edge TPUOttimizzato per l'hardware Edge TPU di GoogleEsclusivo per dispositivi Edge TPUIn crescita grazie a Google e alle risorse di terze partiDispositivi IoT che richiedono elaborazione in tempo realeMiglioramenti per il nuovo hardware Edge TPUSolida sicurezza IoT di GoogleProgettato su misura per Google Coral
TF.jsPrestazioni in-browser ragionevoliElevate con le tecnologie webSupporto per sviluppatori web e Node.jsApplicazioni web interattiveContributi del team TensorFlow e della communityModello di sicurezza della piattaforma webMigliorato con WebGL e altre API
PaddlePaddleCompetitivo, facile da usare e scalabileEcosistema Baidu, ampio supporto alle applicazioniIn rapida crescita, specialmente in CinaMercato cinese ed elaborazione linguisticaFocus sulle applicazioni AI cinesiPone l'accento sulla privacy e la sicurezza dei datiInclusi i chip Kunlun di Baidu
MNNAlte prestazioni per dispositivi mobili.Sistemi ARM mobili ed embedded e CPU X86-64Community di ML mobile/embeddedEfficienza dei sistemi mobiliManutenzione ad alte prestazioni su dispositivi mobiliVantaggi di sicurezza on-deviceOttimizzazioni per CPU e GPU ARM
NCNNOttimizzato per dispositivi mobili basati su ARMSistemi ARM mobili ed embeddedCommunity di ML mobile/embedded di nicchia ma attivaEfficienza dei sistemi Android e ARMManutenzione ad alte prestazioni su ARMVantaggi di sicurezza on-deviceOttimizzazioni per CPU e GPU ARM

Questa analisi comparativa ti fornisce una panoramica di alto livello. Per il deployment, è essenziale considerare i requisiti e i vincoli specifici del tuo progetto e consultare la documentazione dettagliata e le risorse disponibili per ciascuna opzione.

Community e supporto

Quando inizi con YOLO26, avere una community utile e un buon supporto può fare una grande differenza. Ecco come entrare in contatto con altri che condividono i tuoi interessi e ottenere l'assistenza di cui hai bisogno.

Partecipa alla community allargata

  • GitHub Discussions: Il repository di YOLO26 su GitHub ha una sezione "Discussions" dove puoi porre domande, segnalare problemi e suggerire miglioramenti.
  • Server Discord di Ultralytics: Ultralytics ha un server Discord dove puoi interagire con altri utenti e sviluppatori.

Documentazione ufficiale e risorse

  • Documentazione di Ultralytics YOLO26: La documentazione ufficiale fornisce una panoramica completa di YOLO26, insieme a guide su installazione, utilizzo e risoluzione dei problemi.

Queste risorse ti aiuteranno ad affrontare le sfide e a rimanere aggiornato sulle ultime tendenze e best practice nella community di YOLO26.

Conclusione

In questa guida abbiamo esplorato le diverse opzioni di deployment per YOLO26. Abbiamo anche discusso i fattori importanti da considerare quando fai la tua scelta. Queste opzioni ti consentono di personalizzare il tuo modello per vari ambienti e requisiti di prestazioni, rendendolo adatto ad applicazioni del mondo reale.

Non dimenticare che la community di YOLO26 e Ultralytics è una preziosa fonte di aiuto. Connettiti con altri sviluppatori ed esperti per apprendere suggerimenti e soluzioni uniche che potresti non trovare nella documentazione standard. Continua a cercare conoscenza, esplorare nuove idee e condividere le tue esperienze.

FAQ

Quali sono le opzioni di deployment disponibili per YOLO26 su diverse piattaforme hardware?

Ultralytics YOLO26 supporta vari formati di deployment, ciascuno progettato per ambienti e piattaforme hardware specifici. I formati chiave includono:

  • PyTorch per ricerca e prototipazione, con un'eccellente integrazione Python.
  • TorchScript per ambienti di produzione in cui Python non è disponibile.
  • ONNX per compatibilità cross-platform e accelerazione hardware.
  • OpenVINO per prestazioni ottimizzate su hardware Intel.
  • TensorRT per inferenza ad alta velocità su GPU NVIDIA.

Ogni formato ha vantaggi unici. Per una guida dettagliata, consulta la nostra documentazione sul processo di esportazione.

Come posso migliorare la velocità di inferenza del mio modello YOLO26 su una CPU Intel?

Per migliorare la velocità di inferenza su CPU Intel, puoi eseguire il deployment del tuo modello YOLO26 utilizzando il toolkit OpenVINO di Intel. OpenVINO offre significativi aumenti delle prestazioni ottimizzando i modelli per sfruttare in modo efficiente l'hardware Intel.

  1. Converti il tuo modello YOLO26 nel formato OpenVINO utilizzando la funzione model.export().
  2. Segui la guida di configurazione dettagliata nella documentazione di esportazione Intel OpenVINO.

Per ulteriori approfondimenti, dai un'occhiata al nostro post sul blog.

Posso eseguire il deployment dei modelli YOLO26 su dispositivi mobili?

Sì, i modelli YOLO26 possono essere distribuiti su dispositivi mobili utilizzando TensorFlow Lite (TF Lite) sia per piattaforme Android che iOS. TF Lite è progettato per dispositivi mobili ed embedded, fornendo un'efficiente inferenza on-device.

Esempio
# Export command for TFLite format
model.export(format="tflite")

Per ulteriori dettagli sul deployment di modelli su dispositivi mobili, consulta la nostra guida all'integrazione di TF Lite.

Quali fattori dovrei considerare quando scelgo un formato di deployment per il mio modello YOLO26?

Quando scegli un formato di deployment per YOLO26, considera i seguenti fattori:

  • Prestazioni: Alcuni formati come TensorRT forniscono velocità eccezionali su GPU NVIDIA, mentre OpenVINO è ottimizzato per l'hardware Intel.
  • Compatibilità: ONNX offre un'ampia compatibilità tra diverse piattaforme.
  • Facilità di integrazione: Formati come CoreML o TF Lite sono su misura per ecosistemi specifici come rispettivamente iOS e Android.
  • Supporto della community: Formati come PyTorch e TensorFlow dispongono di ampie risorse e supporto della community.

Per un'analisi comparativa, consulta la nostra documentazione sui formati di esportazione.

Come posso eseguire il deployment dei modelli YOLO26 in un'applicazione web?

Per eseguire il deployment dei modelli YOLO26 in un'applicazione web, puoi utilizzare TensorFlow.js (TF.js), che consente di eseguire modelli di machine learning direttamente nel browser. Questo approccio elimina la necessità di infrastrutture di backend e fornisce prestazioni in tempo reale.

  1. Esporta il modello YOLO26 nel formato TF.js.
  2. Integra il modello esportato nella tua applicazione web.

Per istruzioni passo dopo passo, consulta la nostra guida sull'integrazione di TensorFlow.js.

Commenti