Link to this sectionAnalisi comparativa delle opzioni di distribuzione di YOLO26#
Link to this sectionIntroduzione#
Hai fatto molta strada nel tuo percorso con YOLO26. Hai raccolto dati con diligenza, li hai annotati meticolosamente e hai dedicato tempo a addestrare e valutare rigorosamente il tuo modello YOLO26 personalizzato. Ora è il momento di mettere al lavoro il tuo modello per la tua specifica applicazione, caso d'uso o progetto. Ma ti trovi davanti a una decisione cruciale: come esportare e distribuire il tuo modello in modo efficace.
Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀
Questa guida ti accompagna attraverso le opzioni di distribuzione di YOLO26 e i fattori essenziali da considerare per scegliere l'opzione giusta per il tuo progetto.
Link to this sectionCome selezionare l'opzione di distribuzione giusta per il tuo modello YOLO26#
Quando arriva il momento di distribuire il tuo modello YOLO26, selezionare un formato di esportazione adatto è molto importante. Come descritto nella documentazione sulle modalità di Ultralytics YOLO26, la funzione model.export() ti consente di convertire il tuo modello addestrato in una varietà di formati su misura per diversi ambienti e requisiti di prestazioni.
Il formato ideale dipende dal contesto operativo previsto per il tuo modello, bilanciando velocità, vincoli hardware e facilità di integrazione. Per una distribuzione gestita senza esportazione manuale, Ultralytics Platform fornisce endpoint di inferenza pronti all'uso con scalabilità automatica in 43 regioni globali. Nella sezione seguente, esamineremo più da vicino ogni opzione di esportazione, capendo quando scegliere ciascuna di esse.
Link to this sectionOpzioni di distribuzione di YOLO26#
Esaminiamo le diverse opzioni di distribuzione di YOLO26. Per una guida dettagliata al processo di esportazione, visita la pagina della documentazione di Ultralytics sull'esportazione.
Link to this sectionPyTorch#
PyTorch è una libreria di machine learning open-source ampiamente utilizzata per applicazioni nel deep learning e nell'intelligenza artificiale. Offre un alto livello di flessibilità e velocità, il che l'ha resa una delle preferite tra ricercatori e sviluppatori.
- Benchmark delle prestazioni: PyTorch è noto per la sua facilità d'uso e flessibilità, il che può comportare un leggero compromesso nelle prestazioni grezze se confrontato con altri framework più specializzati e ottimizzati.
- Compatibilità e integrazione: Offre un'eccellente compatibilità con varie librerie di data science e machine learning in Python.
- Supporto della comunità ed ecosistema: Una delle comunità più vivaci, con ampie risorse per l'apprendimento e la risoluzione dei problemi.
- Casi di studio: Comunemente utilizzato nei prototipi di ricerca, molti documenti accademici fanno riferimento a modelli distribuiti in PyTorch.
- Manutenzione e aggiornamenti: Aggiornamenti regolari con sviluppo attivo e supporto per nuove funzionalità.
- Considerazioni sulla sicurezza: Patch regolari per problemi di sicurezza, ma la sicurezza dipende in gran parte dall'ambiente complessivo in cui viene distribuito.
- Accelerazione hardware: Supporta CUDA per l'accelerazione GPU, essenziale per velocizzare l'addestramento e l'inferenza del modello.
Link to this sectionTorchScript#
TorchScript estende le capacità di PyTorch consentendo l'esportazione di modelli da eseguire in un ambiente di runtime C++. Questo lo rende adatto ad ambienti di produzione in cui Python non è disponibile.
- Benchmark delle prestazioni: Può offrire prestazioni migliorate rispetto a PyTorch nativo, specialmente in ambienti di produzione.
- Compatibilità e integrazione: Progettato per una transizione senza problemi da PyTorch agli ambienti di produzione C++, sebbene alcune funzionalità avanzate potrebbero non tradursi perfettamente.
- Supporto della comunità ed ecosistema: Beneficia della grande comunità di PyTorch ma ha una portata più ristretta di sviluppatori specializzati.
- Casi di studio: Ampiamente utilizzato in contesti industriali in cui l'overhead di prestazioni di Python è un collo di bottiglia.
- Manutenzione e aggiornamenti: Mantenuto insieme a PyTorch con aggiornamenti coerenti.
- Considerazioni sulla sicurezza: Offre una maggiore sicurezza consentendo l'esecuzione di modelli in ambienti senza installazioni complete di Python.
- Accelerazione hardware: Eredita il supporto CUDA di PyTorch, garantendo un utilizzo efficiente della GPU.
Link to this sectionONNX#
L'Open Neural Network Exchange (ONNX) è un formato che consente l'interoperabilità dei modelli tra diversi framework, il che può essere fondamentale quando si distribuisce su varie piattaforme.
- Benchmark delle prestazioni: I modelli ONNX possono subire prestazioni variabili a seconda del runtime specifico su cui vengono distribuiti.
- Compatibilità e integrazione: Elevata interoperabilità tra piattaforme e hardware grazie alla sua natura indipendente dal framework.
- Supporto della comunità ed ecosistema: Supportato da molte organizzazioni, il che porta a un ampio ecosistema e a una varietà di strumenti per l'ottimizzazione.
- Casi di studio: Frequentemente utilizzato per spostare modelli tra diversi framework di machine learning, dimostrando la sua flessibilità.
- Manutenzione e aggiornamenti: Come standard aperto, ONNX viene regolarmente aggiornato per supportare nuove operazioni e modelli.
- Considerazioni sulla sicurezza: Come per qualsiasi strumento multipiattaforma, è essenziale garantire pratiche sicure nella pipeline di conversione e distribuzione.
- Accelerazione hardware: Con ONNX Runtime, i modelli possono sfruttare varie ottimizzazioni hardware.
Link to this sectionOpenVINO#
OpenVINO è un toolkit Intel progettato per facilitare la distribuzione di modelli di deep learning su hardware Intel, migliorando prestazioni e velocità.
- Benchmark delle prestazioni: Specificamente ottimizzato per CPU, GPU e VPU Intel, offrendo significativi aumenti delle prestazioni su hardware compatibile.
- Compatibilità e integrazione: Funziona meglio all'interno dell'ecosistema Intel ma supporta anche una gamma di altre piattaforme.
- Supporto della comunità ed ecosistema: Supportato da Intel, con una solida base di utenti specialmente nel dominio della computer vision.
- Casi di studio: Spesso utilizzato in scenari IoT e edge computing dove l'hardware Intel è predominante.
- Manutenzione e aggiornamenti: Intel aggiorna regolarmente OpenVINO per supportare i modelli di deep learning più recenti e l'hardware Intel.
- Considerazioni sulla sicurezza: Fornisce robuste funzionalità di sicurezza adatte alla distribuzione in applicazioni sensibili.
- Accelerazione hardware: Su misura per l'accelerazione su hardware Intel, sfruttando set di istruzioni e funzionalità hardware dedicati.
Per ulteriori dettagli sulla distribuzione utilizzando OpenVINO, consulta la documentazione sull'integrazione di Ultralytics: Intel OpenVINO Export.
Link to this sectionTensorRT#
TensorRT è un ottimizzatore e runtime di inferenza di deep learning ad alte prestazioni di NVIDIA, ideale per le applicazioni che necessitano di velocità ed efficienza.
- Benchmark delle prestazioni: Offre prestazioni di alto livello su GPU NVIDIA con supporto per un'inferenza ad alta velocità.
- Compatibilità e integrazione: Più adatto all'hardware NVIDIA, con supporto limitato al di fuori di questo ambiente.
- Supporto della comunità ed ecosistema: Forte rete di supporto attraverso i forum degli sviluppatori e la documentazione di NVIDIA.
- Casi di studio: Ampiamente adottato in settori che richiedono inferenza in tempo reale su dati video e immagini.
- Manutenzione e aggiornamenti: NVIDIA mantiene TensorRT con aggiornamenti frequenti per migliorare le prestazioni e supportare nuove architetture GPU.
- Considerazioni sulla sicurezza: Come molti prodotti NVIDIA, pone una forte enfasi sulla sicurezza, ma le specifiche dipendono dall'ambiente di distribuzione.
- Accelerazione hardware: Progettato esclusivamente per GPU NVIDIA, offrendo ottimizzazione e accelerazione profonde.
Per ulteriori informazioni sulla distribuzione di TensorRT, consulta la guida all'integrazione di TensorRT.
Link to this sectionCoreML#
CoreML è il framework di machine learning di Apple, ottimizzato per le prestazioni sul dispositivo nell'ecosistema Apple, inclusi iOS, macOS, watchOS e tvOS.
- Benchmark delle prestazioni: Ottimizzato per prestazioni sul dispositivo su hardware Apple con un consumo minimo della batteria.
- Compatibilità e integrazione: Esclusivamente per l'ecosistema Apple, fornendo un flusso di lavoro semplificato per applicazioni iOS e macOS.
- Supporto della comunità ed ecosistema: Forte supporto da parte di Apple e di una comunità di sviluppatori dedicata, con ampia documentazione e strumenti.
- Casi di studio: Comunemente utilizzato in applicazioni che richiedono capacità di machine learning sul dispositivo su prodotti Apple.
- Manutenzione e aggiornamenti: Regolarmente aggiornato da Apple per supportare i più recenti progressi nel machine learning e l'hardware Apple.
- Considerazioni sulla sicurezza: Beneficia dell'attenzione di Apple alla privacy dell'utente e alla sicurezza dei dati.
- Accelerazione hardware: Sfrutta appieno il neural engine e la GPU di Apple per attività di machine learning accelerate.
Link to this sectionTF SavedModel#
TF SavedModel è il formato di TensorFlow per salvare e servire modelli di machine learning, particolarmente adatto per ambienti server scalabili.
- Benchmark delle prestazioni: Offre prestazioni scalabili in ambienti server, specialmente se utilizzato con TensorFlow Serving.
- Compatibilità e integrazione: Ampia compatibilità nell'ecosistema di TensorFlow, incluse distribuzioni cloud e server aziendali.
- Supporto della comunità ed ecosistema: Ampio supporto della comunità grazie alla popolarità di TensorFlow, con una vasta gamma di strumenti per la distribuzione e l'ottimizzazione.
- Casi di studio: Estensivamente utilizzato in ambienti di produzione per servire modelli di deep learning su larga scala.
- Manutenzione e aggiornamenti: Supportato da Google e dalla comunità di TensorFlow, garantendo aggiornamenti regolari e nuove funzionalità.
- Considerazioni sulla sicurezza: La distribuzione tramite TensorFlow Serving include robuste funzionalità di sicurezza per applicazioni di livello aziendale.
- Accelerazione hardware: Supporta varie accelerazioni hardware tramite i backend di TensorFlow.
Link to this sectionTF GraphDef#
TF GraphDef è un formato TensorFlow che rappresenta il modello come un grafo, utile per ambienti in cui è richiesto un grafo di calcolo statico.
- Benchmark delle prestazioni: Fornisce prestazioni stabili per grafi di calcolo statici, con un focus su coerenza e affidabilità.
- Compatibilità e integrazione: Si integra facilmente nell'infrastruttura di TensorFlow ma è meno flessibile rispetto a SavedModel.
- Supporto della comunità ed ecosistema: Buon supporto dall'ecosistema di TensorFlow, con molte risorse disponibili per l'ottimizzazione di grafi statici.
- Casi di studio: Utile in scenari in cui è necessario un grafo statico, come in alcuni sistemi embedded.
- Manutenzione e aggiornamenti: Aggiornamenti regolari insieme agli aggiornamenti principali di TensorFlow.
- Considerazioni sulla sicurezza: Garantisce una distribuzione sicura con le pratiche di sicurezza stabilite di TensorFlow.
- Accelerazione hardware: Può utilizzare le opzioni di accelerazione hardware di TensorFlow, sebbene non sia flessibile come SavedModel.
Scopri di più su TF GraphDef nella nostra guida all'integrazione di TF GraphDef.
Link to this sectionTF Lite#
TF Lite è la soluzione di TensorFlow per il machine learning su dispositivi mobili ed embedded, fornendo una libreria leggera per l'inferenza sul dispositivo.
- Benchmark delle prestazioni: Progettato per velocità ed efficienza su dispositivi mobili ed embedded.
- Compatibilità e integrazione: Può essere utilizzato su una vasta gamma di dispositivi grazie alla sua natura leggera.
- Supporto della comunità ed ecosistema: Supportato da Google, ha una comunità solida e un numero crescente di risorse per gli sviluppatori.
- Casi di studio: Popolare in applicazioni mobili che richiedono inferenza sul dispositivo con un ingombro minimo.
- Manutenzione e aggiornamenti: Regolarmente aggiornato per includere le funzionalità e le ottimizzazioni più recenti per i dispositivi mobili.
- Considerazioni sulla sicurezza: Fornisce un ambiente sicuro per l'esecuzione di modelli sui dispositivi degli utenti finali.
- Accelerazione hardware: Supporta una varietà di opzioni di accelerazione hardware, incluse GPU e DSP.
Link to this sectionTF Edge TPU#
TF Edge TPU è progettato per un calcolo ad alta velocità ed efficiente sull'hardware Edge TPU di Google, perfetto per dispositivi IoT che richiedono elaborazione in tempo reale.
- Benchmark delle prestazioni: Specificamente ottimizzato per un calcolo ad alta velocità ed efficiente sull'hardware Edge TPU di Google.
- Compatibilità e integrazione: Funziona esclusivamente con modelli TensorFlow Lite su dispositivi Edge TPU.
- Supporto della comunità ed ecosistema: Supporto crescente con risorse fornite da Google e sviluppatori di terze parti.
- Casi di studio: Utilizzato in dispositivi IoT e applicazioni che richiedono elaborazione in tempo reale con bassa latenza.
- Manutenzione e aggiornamenti: Continuamente migliorato per sfruttare le capacità delle nuove versioni dell'hardware Edge TPU.
- Considerazioni sulla sicurezza: Si integra con la solida sicurezza di Google per dispositivi IoT ed edge.
- Accelerazione hardware: Progettato su misura per sfruttare appieno i dispositivi Google Coral.
Link to this sectionHailo HEF#
Hailo HEF è un formato eseguibile compilato per gli acceleratori AI Hailo, inclusi i dispositivi Hailo-8, Hailo-8L e Hailo-15. I modelli di rilevamento Ultralytics YOLO vengono esportati prima in ONNX, quindi compilati in HEF con l'esterno Hailo Dataflow Compiler. HEF non è un target di esportazione diretto di Ultralytics; per i flussi di lavoro di accelerazione edge supportati, confronta prima Axelera AI e DeepX.
- Benchmark delle prestazioni: Dipende dall'hardware Hailo, dalla versione dell'SDK Hailo, dallo script del modello, dalla configurazione NMS e dai dati di calibrazione.
- Compatibilità e integrazione: Solo per sistemi embedded basati su Hailo, gateway industriali e distribuzioni di Raspberry Pi AI Kit.
- Supporto della community ed ecosistema: Supportato tramite Hailo Developer Zone, HailoRT, TAPPAS e il Hailo Model Zoo.
- Casi d'uso: Utile per il rilevamento di oggetti in tempo reale su fotocamere, robotica, controllo accessi, smart city e dispositivi di ispezione industriale.
- Manutenzione e aggiornamenti: Dipende dagli aggiornamenti di Hailo SDK, firmware e model-zoo per i nuovi target dell'acceleratore.
- Considerazioni sulla sicurezza: Supporta l'inferenza locale on-device in cui i dati rimangono all'edge.
- Accelerazione hardware: Utilizza l'esecuzione Hailo NPU tramite artefatti HEF compilati.
Per un flusso di lavoro passo dopo passo, consulta la guida all'integrazione di Hailo.
Link to this sectionTF.js#
TensorFlow.js (TF.js) è una libreria che porta le funzionalità di machine learning direttamente nel browser, offrendo un nuovo regno di possibilità sia per gli sviluppatori web che per gli utenti. Consente l'integrazione di modelli di machine learning nelle applicazioni web senza la necessità di un'infrastruttura back-end.
- Benchmark delle prestazioni: Abilita il machine learning direttamente nel browser con prestazioni ragionevoli, a seconda del dispositivo client.
- Compatibilità e integrazione: Elevata compatibilità con le tecnologie web, consentendo una facile integrazione nelle applicazioni web.
- Supporto della community ed ecosistema: Supporto da una community di sviluppatori web e Node.js, con una varietà di strumenti per il deployment di modelli ML nei browser.
- Casi d'uso: Ideale per applicazioni web interattive che traggono vantaggio dal machine learning lato client senza la necessità di un'elaborazione lato server.
- Manutenzione e aggiornamenti: Mantenuto dal team di TensorFlow con contributi dalla community open-source.
- Considerazioni sulla sicurezza: Viene eseguito all'interno del contesto sicuro del browser, utilizzando il modello di sicurezza della piattaforma web.
- Accelerazione hardware: Le prestazioni possono essere migliorate con API basate sul web che accedono all'accelerazione hardware come WebGL.
Link to this sectionPaddlePaddle#
PaddlePaddle è un framework di deep learning open-source sviluppato da Baidu. È progettato per essere efficiente per i ricercatori e facile da usare per gli sviluppatori. È particolarmente popolare in Cina e offre un supporto specializzato per l'elaborazione della lingua cinese.
- Benchmark delle prestazioni: Offre prestazioni competitive con un focus sulla facilità d'uso e sulla scalabilità.
- Compatibilità e integrazione: Ben integrato nell'ecosistema di Baidu e supporta una vasta gamma di applicazioni.
- Supporto della community ed ecosistema: Sebbene la community sia più piccola a livello globale, sta crescendo rapidamente, specialmente in Cina.
- Casi d'uso: Comunemente utilizzato nei mercati cinesi e dagli sviluppatori che cercano alternative ad altri framework principali.
- Manutenzione e aggiornamenti: Aggiornato regolarmente con un focus sul supporto ad applicazioni e servizi AI in lingua cinese.
- Considerazioni sulla sicurezza: Enfatizza la privacy dei dati e la sicurezza, soddisfacendo gli standard di governance dei dati cinesi.
- Accelerazione hardware: Supporta varie accelerazioni hardware, inclusi i chip Kunlun di Baidu.
Link to this sectionMNN#
MNN è un framework di deep learning altamente efficiente e leggero. Supporta l'inferenza e l'addestramento di modelli di deep learning e vanta prestazioni leader del settore per l'inferenza e l'addestramento on-device. Inoltre, MNN è utilizzato anche su dispositivi embedded, come IoT.
- Benchmark delle prestazioni: Alte prestazioni per dispositivi mobili con un'eccellente ottimizzazione per i sistemi ARM.
- Compatibilità e integrazione: Funziona bene con sistemi mobili ed embedded ARM e architetture CPU X86-64.
- Supporto della community ed ecosistema: Supportato dalla community di machine learning mobile ed embedded.
- Casi d'uso: Ideale per applicazioni che richiedono prestazioni efficienti su sistemi mobili.
- Manutenzione e aggiornamenti: Mantenuto regolarmente per garantire prestazioni elevate sui dispositivi mobili.
- Considerazioni sulla sicurezza: Fornisce vantaggi in termini di sicurezza on-device mantenendo i dati in locale.
- Accelerazione hardware: Ottimizzato per CPU e GPU ARM per la massima efficienza.
Link to this sectionNCNN#
NCNN è un framework di inferenza di reti neurali ad alte prestazioni ottimizzato per la piattaforma mobile. Si distingue per la sua natura leggera ed efficienza, rendendolo particolarmente adatto a dispositivi mobili ed embedded in cui le risorse sono limitate.
- Benchmark delle prestazioni: Altamente ottimizzato per piattaforme mobili, offrendo un'inferenza efficiente su dispositivi basati su ARM.
- Compatibilità e integrazione: Adatto per applicazioni su telefoni cellulari e sistemi embedded con architettura ARM.
- Supporto della community ed ecosistema: Supportato da una community di nicchia ma attiva focalizzata su applicazioni ML mobili ed embedded.
- Casi d'uso: Favorito per le applicazioni mobili dove l'efficienza e la velocità sono critiche su Android e altri sistemi basati su ARM.
- Manutenzione e aggiornamenti: Migliorato continuamente per mantenere alte prestazioni su una gamma di dispositivi ARM.
- Considerazioni sulla sicurezza: Si concentra sull'esecuzione locale sul dispositivo, sfruttando la sicurezza intrinseca dell'elaborazione on-device.
- Accelerazione hardware: Su misura per CPU e GPU ARM, con ottimizzazioni specifiche per queste architetture.
Link to this sectionAnalisi comparativa delle opzioni di distribuzione di YOLO26#
La seguente tabella fornisce un'istantanea delle varie opzioni di deployment disponibili per i modelli YOLO26, aiutandoti a valutare quale si adatta meglio alle esigenze del tuo progetto in base a diversi criteri critici. Per uno sguardo approfondito al formato di ciascuna opzione di deployment, consulta la pagina della documentazione di Ultralytics sui formati di esportazione.
| Opzione di deployment | Benchmark delle prestazioni | Compatibilità e integrazione | Supporto della community ed ecosistema | Casi d'uso | Manutenzione e aggiornamenti | Considerazioni sulla sicurezza | Accelerazione hardware |
|---|---|---|---|---|---|---|---|
| PyTorch | Buona flessibilità; potrebbe scendere a compromessi sulle prestazioni grezze | Eccellente con le librerie Python | Risorse estese e community | Ricerca e prototipi | Sviluppo regolare e attivo | Dipendente dall'ambiente di deployment | Supporto CUDA per accelerazione GPU |
| TorchScript | Migliore per la produzione rispetto a PyTorch | Transizione fluida da PyTorch a C++ | Specializzato ma più ristretto rispetto a PyTorch | Settore in cui Python rappresenta un collo di bottiglia | Aggiornamenti coerenti con PyTorch | Sicurezza migliorata senza Python completo | Eredita il supporto CUDA da PyTorch |
| ONNX | Variabile a seconda del runtime | Alta tra diversi framework | Ampio ecosistema, supportato da molte organizzazioni | Flessibilità tra framework ML | Aggiornamenti regolari per nuove operazioni | Garantire pratiche sicure di conversione e deployment | Varie ottimizzazioni hardware |
| OpenVINO | Ottimizzato per hardware Intel | Migliore all'interno dell'ecosistema Intel | Solido nel dominio della computer vision | IoT ed edge con hardware Intel | Aggiornamenti regolari per hardware Intel | Funzionalità robuste per applicazioni sensibili | Su misura per hardware Intel |
| TensorRT | Di alto livello su GPU NVIDIA | Migliore per hardware NVIDIA | Forte network tramite NVIDIA | Inferenza video e immagini in tempo reale | Aggiornamenti frequenti per nuove GPU | Enfasi sulla sicurezza | Progettato per GPU NVIDIA |
| CoreML | Ottimizzato per hardware Apple on-device | Esclusivo per l'ecosistema Apple | Forte supporto Apple e per sviluppatori | ML on-device su prodotti Apple | Aggiornamenti Apple regolari | Focus sulla privacy e sicurezza | Apple neural engine e GPU |
| TF SavedModel | Scalabile in ambienti server | Ampia compatibilità nell'ecosistema TensorFlow | Supporto esteso grazie alla popolarità di TensorFlow | Modelli di serving su larga scala | Aggiornamenti regolari da parte di Google e della community | Funzionalità robuste per l'enterprise | Varie accelerazioni hardware |
| TF GraphDef | Stabile per grafi di calcolo statici | Si integra bene con l'infrastruttura TensorFlow | Risorse per l'ottimizzazione di grafi statici | Scenari che richiedono grafi statici | Aggiornamenti insieme al core di TensorFlow | Pratiche di sicurezza consolidate per TensorFlow | Opzioni di accelerazione per TensorFlow |
| TF Lite | Velocità ed efficienza su dispositivi mobili/embedded | Ampia gamma di supporto per i dispositivi | Community solida, supportata da Google | Applicazioni mobili con ingombro minimo | Ultime funzionalità per il mobile | Ambiente sicuro su dispositivi dell'utente finale | GPU e DSP tra gli altri |
| TF Edge TPU | Ottimizzato per l'hardware Edge TPU di Google | Esclusivo per dispositivi Edge TPU | In crescita con le risorse di Google e di terze parti | Dispositivi IoT che richiedono elaborazione in tempo reale | Miglioramenti per il nuovo hardware Edge TPU | Sicurezza IoT robusta di Google | Progettato su misura per Google Coral |
| Hailo HEF | Specifico per l'hardware e compilato esternamente | Dispositivi Hailo e Raspberry Pi AI Kit | Hailo Developer Zone e Model Zoo | Distribuzioni Hailo esistenti | Aggiornamenti per Hailo SDK e firmware | L'inferenza on-device mantiene i dati locali | Hailo NPU tramite artefatti HEF |
| TF.js | Prestazioni in-browser ragionevoli | Elevate con le tecnologie web | Supporto per sviluppatori Web e Node.js | Applicazioni web interattive | Contributi del team TensorFlow e della community | Modello di sicurezza della piattaforma web | Potenziato con WebGL e altre API |
| PaddlePaddle | Competitivo, facile da usare e scalabile | Ecosistema Baidu, ampio supporto alle applicazioni | In rapida crescita, specialmente in Cina | Mercato cinese ed elaborazione linguistica | Focus sulle applicazioni AI cinesi | Enfatizza la privacy e la sicurezza dei dati | Inclusi i chip Kunlun di Baidu |
| MNN | Alte prestazioni per dispositivi mobili. | Sistemi mobili e embedded ARM e CPU X86-64 | Community ML mobile/embedded | Efficienza dei sistemi mobili | Manutenzione ad alte prestazioni su dispositivi mobili | Vantaggi di sicurezza on-device | Ottimizzazioni per CPU e GPU ARM |
| NCNN | Ottimizzato per dispositivi mobili basati su ARM | Sistemi mobili e embedded ARM | Community ML mobile/embedded di nicchia ma attiva | Efficienza dei sistemi Android e ARM | Manutenzione ad alte prestazioni su ARM | Vantaggi di sicurezza on-device | Ottimizzazioni per CPU e GPU ARM |
Questa analisi comparativa ti offre una panoramica ad alto livello. Per il deployment, è essenziale considerare i requisiti e i vincoli specifici del tuo progetto e consultare la documentazione dettagliata e le risorse disponibili per ciascuna opzione.
Link to this sectionCommunity e supporto#
Quando inizi a lavorare con YOLO26, avere una community utile e del supporto può fare una differenza significativa. Ecco come entrare in contatto con altri che condividono i tuoi interessi e ottenere l'assistenza di cui hai bisogno.
Link to this sectionInteragisci con la community più ampia#
- GitHub Discussions: Il repository di YOLO26 su GitHub ha una sezione "Discussions" dove puoi porre domande, segnalare problemi e suggerire miglioramenti.
- Server Discord di Ultralytics: Ultralytics ha un server Discord dove puoi interagire con altri utenti e sviluppatori.
Link to this sectionDocumentazione ufficiale e risorse#
- Documentazione di Ultralytics YOLO26: La documentazione ufficiale fornisce una panoramica completa di YOLO26, insieme a guide sull'installazione, l'utilizzo e la risoluzione dei problemi.
Queste risorse ti aiuteranno ad affrontare le sfide e a rimanere aggiornato sulle ultime tendenze e best practice nella community YOLO26.
Link to this sectionConclusione#
In questa guida, abbiamo esplorato le diverse opzioni di deployment per YOLO26. Abbiamo anche discusso i fattori importanti da considerare quando fai la tua scelta. Queste opzioni ti consentono di personalizzare il tuo modello per vari ambienti e requisiti di prestazioni, rendendolo adatto ad applicazioni del mondo reale.
Non dimenticare che la community di YOLO26 e Ultralytics è una preziosa fonte di aiuto. Connettiti con altri sviluppatori ed esperti per apprendere suggerimenti e soluzioni uniche che potresti non trovare nella normale documentazione. Continua a cercare conoscenza, esplorare nuove idee e condividere le tue esperienze.
Link to this sectionFAQ#
Link to this sectionQuali sono le opzioni di deployment disponibili per YOLO26 su diverse piattaforme hardware?#
Ultralytics YOLO26 supporta vari formati di deployment, ciascuno progettato per ambienti e piattaforme hardware specifici. I formati chiave includono:
- PyTorch per ricerca e prototipazione, con un'eccellente integrazione Python.
- TorchScript per ambienti di produzione in cui Python non è disponibile.
- ONNX per la compatibilità multipiattaforma e l'accelerazione hardware.
- OpenVINO per prestazioni ottimizzate su hardware Intel.
- TensorRT per l'inferenza ad alta velocità su GPU NVIDIA.
Ogni formato ha vantaggi unici. Per una guida dettagliata, consulta la nostra documentazione sul processo di esportazione.
Link to this sectionCome posso migliorare la velocità di inferenza del mio modello YOLO26 su una CPU Intel?#
Per migliorare la velocità di inferenza sulle CPU Intel, puoi eseguire il deployment del tuo modello YOLO26 utilizzando il toolkit OpenVINO di Intel. OpenVINO offre notevoli incrementi delle prestazioni ottimizzando i modelli per sfruttare in modo efficiente l'hardware Intel.
- Converti il tuo modello YOLO26 nel formato OpenVINO utilizzando la funzione
model.export(). - Segui la guida di configurazione dettagliata nella documentazione di esportazione Intel OpenVINO.
Per ulteriori approfondimenti, dai un'occhiata al nostro post sul blog.
Link to this sectionPosso eseguire il deployment di modelli YOLO26 su dispositivi mobili?#
Sì, i modelli YOLO26 possono essere distribuiti su dispositivi mobili utilizzando TensorFlow Lite (TF Lite) sia per piattaforme Android che iOS. TF Lite è progettato per dispositivi mobili ed embedded, fornendo un'inferenza on-device efficiente.
# Export command for TFLite format
model.export(format="tflite")Per ulteriori dettagli sul deployment di modelli su dispositivi mobili, consulta la nostra guida all'integrazione di TF Lite.
Link to this sectionQuali fattori dovrei considerare quando scelgo un formato di deployment per il mio modello YOLO26?#
Quando scegli un formato di deployment per YOLO26, considera i seguenti fattori:
- Prestazioni: Alcuni formati come TensorRT offrono velocità eccezionali sulle GPU NVIDIA, mentre OpenVINO è ottimizzato per l'hardware Intel.
- Compatibilità: ONNX offre un'ampia compatibilità tra diverse piattaforme.
- Facilità di integrazione: Formati come CoreML o TF Lite sono su misura per ecosistemi specifici come iOS e Android, rispettivamente.
- Supporto della community: Formati come PyTorch e TensorFlow dispongono di ampie risorse di supporto della community.
Per un'analisi comparativa, consulta la nostra documentazione sui formati di esportazione.
Link to this sectionCome posso eseguire il deployment di modelli YOLO26 in un'applicazione web?#
Per distribuire modelli YOLO26 in un'applicazione web, puoi utilizzare TensorFlow.js (TF.js), che consente di eseguire modelli di machine learning direttamente nel browser. Questo approccio elimina la necessità di un'infrastruttura backend e offre prestazioni in tempo reale.
- Esporta il modello YOLO26 nel formato TF.js.
- Integra il modello esportato nella tua applicazione web.
Per istruzioni passo-passo, consulta la nostra guida sull'integrazione di TensorFlow.js.