Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 contro YOLOv10#

Il panorama della visione artificiale è in costante evoluzione, spinto dalla richiesta di modelli più veloci, precisi ed efficienti. Questa guida fornisce un confronto tecnico completo tra due architetture rivoluzionarie nel campo del rilevamento oggetti in tempo reale: YOLO26 e YOLOv10. Analizzando le loro architetture, le metriche di prestazione e le capacità di distribuzione, puntiamo ad aiutare sviluppatori e ricercatori a scegliere il modello ottimale per le loro applicazioni di visione.

Link to this sectionL'evoluzione delle architetture senza NMS#

Per anni, la famiglia YOLO (You Only Look Once) ha fatto grande affidamento sulla Non-Maximum Suppression (NMS) per filtrare i riquadri di delimitazione ridondanti durante la post-elaborazione. Sebbene efficace, la NMS introduce latenza nell'inferenza e complica la distribuzione su dispositivi edge come il Raspberry Pi o unità di elaborazione neurale (NPU) specializzate.

L'introduzione di YOLOv10 ha rappresentato un cambio di paradigma introducendo un design end-to-end senza NMS. Partendo da questo fondamentale passo avanti, Ultralytics YOLO26 ha perfezionato l'architettura per gli ambienti di produzione, raggiungendo un'efficienza e una facilità d'uso senza precedenti in una gamma più ampia di attività.

Il collo di bottiglia della post-elaborazione

Rimuovere la NMS elimina il passaggio di post-elaborazione dinamico e dipendente dai dati che tradizionalmente ostacolava l'ottimizzazione dei modelli di visione artificiale su acceleratori hardware come TensorRT e OpenVINO.

Link to this sectionYOLOv10: pioniere del rilevamento senza NMS#

Data: 23-05-2024
Autori: Ao Wang, Hui Chen, Lihao Liu, et al.
Organizzazione: Tsinghua University
Risorse: ArXiv Paper | GitHub Repository

Sviluppato dai ricercatori della Tsinghua University, YOLOv10 ha introdotto una strategia coerente di doppia assegnazione per eliminare la necessità di NMS. Utilizzando un design del modello olistico basato sull'efficienza e l'accuratezza, ha ridotto la ridondanza computazionale mantenendo un elevato mAP (mean Average Precision).

Punti di forza:

  • Architettura senza NMS: Il pioniere originale del design senza NMS nella serie YOLO, che riduce drasticamente la latenza per le applicazioni in tempo reale.
  • Efficienza: Offre un solido compromesso tra numero di parametri e velocità di inferenza rispetto ai modelli di generazione precedente.

Debolezze:

  • Supporto limitato per le attività: Focalizzato principalmente sul rilevamento standard degli oggetti, manca di un supporto nativo immediato per attività avanzate come la segmentazione o la stima della posa.
  • Focus accademico: La base di codice, sebbene robusta, pende più verso la ricerca che verso una distribuzione in produzione snella e di livello aziendale.

Scopri di più su YOLOv10

Link to this sectionYOLO26: Il nuovo standard per Edge e Cloud#

Data: 14-01-2026
Autori: Glenn Jocher e Jing Qiu
Organizzazione: Ultralytics
Risorse: GitHub Repository | Ultralytics Platform

Rilasciato come successore di YOLO11, YOLO26 porta il concetto senza NMS alla sua realizzazione definitiva. Integra nativamente il rilevamento end-to-end nella Ultralytics Platform, altamente ottimizzata, fornendo una suite completa di strumenti per la moderna pipeline di machine learning.

YOLO26 introduce diversi progressi architettonici:

  • Rimozione della DFL: La Distribution Focal Loss è stata completamente rimossa. Questo semplifica drasticamente il processo di esportazione del modello e migliora la compatibilità con i dispositivi edge e a basso consumo.
  • Inferenza CPU fino al 43% più veloce: Grazie alla rimozione della DFL e alle ottimizzazioni strutturali, YOLO26 è significativamente più veloce sulle CPU, rendendolo ideale per distribuzioni IoT e mobile.
  • Ottimizzatore MuSGD: Ispirato dalle tecniche di addestramento dei modelli linguistici di grandi dimensioni (LLM) (come Kimi K2 di Moonshot AI), YOLO26 utilizza un ibrido di SGD e Muon. Ciò porta una stabilità di addestramento senza pari e una convergenza più rapida alla visione artificiale.
  • ProgLoss + STAL: Queste funzioni di perdita avanzate offrono notevoli miglioramenti nel riconoscimento di piccoli oggetti, il che è fondamentale per immagini aeree e monitoraggio della sicurezza basato su droni.
  • Miglioramenti specifici per attività: YOLO26 non è solo un rilevatore. È dotato di perdita per la segmentazione semantica e proto multiscala per la segmentazione, stima della verosimiglianza logaritmica residua (RLE) per la stima della posa e perdita angolare specializzata per i riquadri di delimitazione orientati (OBB).

Scopri di più su YOLO26

Link to this sectionAnalisi delle prestazioni e metriche#

La seguente tabella confronta le prestazioni di rilevamento COCO dei modelli YOLO26 e YOLOv10. Nota come YOLO26 ottenga un'accuratezza superiore mantenendo un'eccezionale efficienza dei parametri.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionIl vantaggio di Ultralytics: efficienza di addestramento e memoria#

Quando distribuisci modelli in produzione, i requisiti di memoria e l'efficienza dell'addestramento sono cruciali tanto quanto la velocità di inferenza. I modelli Ultralytics, in particolare YOLO26, sono altamente ottimizzati per ridurre l'utilizzo della memoria CUDA durante l'addestramento. Ciò consente agli sviluppatori di utilizzare batch size più ampi su GPU di livello consumer, riducendo drasticamente i tempi di addestramento e i costi computazionali. Al contrario, architetture complesse o pesanti modelli Transformer come RT-DETR richiedono spesso hardware costoso e di fascia alta per addestrarsi efficacemente.

Integrazione continua ed ecosistema

Uno dei maggiori vantaggi nello scegliere YOLO26 è la sua integrazione con l'ecosistema Ultralytics, ben mantenuto. Dall'annotazione dei dati al monitoraggio degli esperimenti, la piattaforma fornisce tutto ciò di cui un ingegnere di machine learning ha bisogno sotto un unico tetto unificato.

Link to this sectionImplementazione pratica: esempio di codice#

Il marchio di fabbrica di Ultralytics è la sua facilità d'uso leader nel settore. Con un'intuitiva API Python, la migrazione da un modello legacy come YOLOv8 al modello di punta YOLO26 richiede l'aggiornamento di una sola riga di codice.

Ecco un esempio eseguibile al 100% che mostra come addestrare ed eseguire inferenze utilizzando YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLO26 e YOLOv10 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze sull'ecosistema.

Link to this sectionQuando scegliere YOLO26#

YOLO26 è una scelta valida per:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionQuando scegliere YOLOv10#

YOLOv10 è consigliato per:

  • Rilevamento in tempo reale senza NMS: Applicazioni che traggono vantaggio dal rilevamento end-to-end senza Non-Maximum Suppression, riducendo la complessità di distribuzione.
  • Compromessi bilanciati tra velocità e precisione: Progetti che richiedono un ottimo equilibrio tra velocità di inferenza e precisione di rilevamento su diverse scale di modello.
  • Applicazioni a latenza costante: Scenari di distribuzione in cui tempi di inferenza prevedibili sono fondamentali, come nella robotica o nei sistemi autonomi.

Link to this sectionConclusione#

Mentre YOLOv10 ha dato un contributo significativo alla comunità accademica introducendo il paradigma senza NMS, YOLO26 eleva questa tecnologia a una prontezza di livello aziendale. Con il suo notevole incremento del 43% nella velocità della CPU, l'innovativo ottimizzatore MuSGD e una versatilità impareggiabile in tutte le attività di visione, YOLO26 si distingue come la scelta definitiva sia per l'edge computing che per le distribuzioni cloud su larga scala.

Per i team che danno priorità a una comunità attiva, una documentazione completa e un'esperienza di sviluppo senza attriti, l'ecosistema Ultralytics è impareggiabile. Se stai esplorando modelli per scenari specializzati, potresti anche voler esaminare YOLO-World per il rilevamento zero-shot a vocabolario aperto. Tuttavia, per la stragrande maggioranza dei casi d'uso reali, YOLO26 è la raccomandazione definitiva.

Collaboratori

Commenti