Link to this sectionYOLO26 contro YOLO11#
Quando costruisci sistemi di visione artificiale all'avanguardia, la scelta del modello giusto è fondamentale per bilanciare precisione, latenza ed efficienza delle risorse. Nel panorama in rapida evoluzione dell'intelligenza artificiale, Ultralytics continua a superare i confini di ciò che è possibile. Questo confronto tecnico dettagliato esplora il passaggio dal grande successo YOLO11 al rivoluzionario nuovo YOLO26, fornendo a ingegneri e ricercatori AI le intuizioni necessarie per prendere decisioni architetturali informate.
Link to this sectionOrigine e metadati del modello#
Entrambi i modelli sono stati sviluppati da Ultralytics, ma rappresentano paradigmi diversi nella linea temporale del rilevamento oggetti e dei modelli di visione multi-task.
Dettagli di YOLO26:
- Autori: Glenn Jocher e Jing Qiu
- Organizzazione: Ultralytics
- Data: 2026-01-14
- GitHub: Repository Ultralytics
- Documentazione: Documentazione ufficiale YOLO26
Dettagli YOLO11:
- Autori: Glenn Jocher e Jing Qiu
- Organizzazione: Ultralytics
- Data: 2024-09-27
- GitHub: Repository Ultralytics
- Documentazione: Documentazione ufficiale di YOLO11
Link to this sectionDifferenze architetturali e innovazioni#
Il salto da YOLO11 a YOLO26 comporta cambiamenti fondamentali sia nell'architettura del modello che nel regime di addestramento sottostante. Mentre YOLO11 ha stabilito una solida base per il rilevamento oggetti e l'apprendimento multi-task, YOLO26 rivoluziona completamente la pipeline di distribuzione per l'edge computing.
Link to this sectionDesign end-to-end senza NMS#
Uno degli aggiornamenti più significativi in YOLO26 è la sua architettura nativamente end-to-end. A differenza di YOLO11, che si affida al post-processing Non-Maximum Suppression (NMS) per filtrare i bounding box sovrapposti, YOLO26 elimina completamente questo passaggio. Questo concetto, introdotto per la prima volta in YOLOv10, riduce drasticamente la variabilità della latenza e semplifica la logica di distribuzione su diversi dispositivi edge.
Link to this sectionRimozione di DFL per l'efficienza edge#
YOLO11 utilizza la Distribution Focal Loss (DFL) per perfezionare le stime dei bounding box. Tuttavia, la DFL si basa su complesse operazioni softmax spesso poco supportate dagli acceleratori edge a basso consumo. YOLO26 rimuove con successo la DFL senza sacrificare la precisione. Questa semplificazione architetturale si traduce in una compatibilità notevolmente migliorata con i sistemi embedded e consente a YOLO26 di raggiungere fino al 43% di velocità di inferenza CPU in più rispetto al suo predecessore.
Link to this sectionL'ottimizzatore MuSGD#
La stabilità e la velocità dell'addestramento sono fondamentali. YOLO26 introduce l'ottimizzatore MuSGD, un ibrido tra Stochastic Gradient Descent (SGD) e Muon, fortemente ispirato alle innovazioni nell'addestramento dei LLM di Kimi K2 di Moonshot AI. Questo ottimizzatore porta la stabilità dell'addestramento dei modelli linguistici alla visione artificiale, garantendo una convergenza più rapida e riducendo l'impronta di memoria durante l'addestramento rispetto alle pesanti alternative transformer.
Link to this sectionProgLoss e STAL#
Per i ricercatori che lavorano con immagini aeree o applicazioni con droni, il rilevamento di caratteristiche minuscole è una sfida storica. YOLO26 introduce ProgLoss combinato con STAL (Scale-Targeted Attention Loss), offrendo miglioramenti notevoli nel riconoscimento di piccoli oggetti rispetto a YOLO11.
Link to this sectionConfronto tra prestazioni e metriche#
Confrontando i modelli testa a testa, YOLO26 dimostra una netta superiorità in precisione ed efficienza sui dispositivi edge, mantenendo al contempo i requisiti di memoria incredibilmente bassi caratteristici dell'ecosistema Ultralytics.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Nota: Il modello YOLO26 nano (YOLO26n) mostra un miglioramento di circa il 31% nella velocità della CPU rispetto a YOLO11n (38.9ms contro 56.1ms), evidenziando la sua filosofia di design incentrata sull'edge.
Link to this sectionVersatilità attraverso le attività di visione artificiale#
Entrambi i modelli traggono vantaggio dall'ecosistema Ultralytics, altamente manutenuto, offrendo una facilità d'uso senza pari attraverso una API Python unificata. Non sono solo rilevatori di oggetti; sono potenze multi-task. Tuttavia, YOLO26 incorpora diversi progressi specifici per ogni attività:
- Segmentazione di istanze: YOLO26 utilizza una perdita di segmentazione semantica raffinata e la prototipazione multi-scala, generando confini di maschera più nitidi rispetto a YOLO11. Scopri di più sui flussi di lavoro di segmentazione.
- Stima della posa: Integrando la Residual Log-Likelihood Estimation (RLE), YOLO26 migliora drasticamente la precisione dei punti chiave nelle pose umane complesse. Scopri le funzionalità di stima della posa.
- Bounding Box orientati (OBB): Una funzione di perdita angolare specializzata risolve i problemi storici di discontinuità dei bordi, rendendo YOLO26 eccezionalmente affidabile per il rilevamento di oggetti ruotati nei feed satellitari. Leggi le attività OBB.
- Classificazione delle immagini: Entrambi i modelli gestiscono la classificazione ad alta velocità in modo efficiente, con YOLO26 che offre miglioramenti marginali nella precisione top-1 su ImageNet.
Link to this sectionEsempio di codice per addestramento e inferenza#
Ultralytics is celebrated for its developer experience. Training a SOTA model or running an inference script takes only a few lines of code, minimizing boilerplate and maximizing productivity. Furthermore, training YOLO models requires significantly less CUDA memory than large transformer networks.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()Link to this sectionCasi d'uso ideali e strategie di distribuzione#
Scegliere tra YOLO26 e YOLO11 dipende interamente dai vincoli del tuo ambiente di produzione.
Link to this sectionQuando distribuire YOLO26#
YOLO26 è la scelta definitiva per progetti moderni e da zero. È costruito specificamente per:
- Edge Computing e IoT: Le sue straordinarie prestazioni CPU e la rimozione di DFL lo rendono il re di dispositivi come Raspberry Pi, NPU Coral e processori mobili.
- Analisi di droni e aeree: L'integrazione di ProgLoss + STAL lo rende unicamente capace di tracciare oggetti minuscoli e in rapido movimento su paesaggi estesi.
- Latency-Critical Applications: In autonomous robotics or manufacturing quality control, the NMS-free design ensures deterministic latency without unexpected post-processing spikes.
Link to this sectionQuando mantenere YOLO11#
Sebbene YOLO26 sia superiore, YOLO11 rimane un modello incredibilmente capace. Potresti voler restare con YOLO11 se:
- Pipeline legacy: La tua infrastruttura di distribuzione C++ esistente è strettamente accoppiata alle specifiche uscite basate su anchor e alla logica NMS delle architetture più vecchie.
- Baselines accademiche: Stai pubblicando una ricerca e hai bisogno di uno standard del 2024 altamente riconosciuto per confrontare i tuoi nuovi algoritmi.
Link to this sectionIl potere dell'ecosistema Ultralytics#
Indipendentemente dal fatto che tu distribuisca YOLO11 o YOLO26, utilizzare i modelli Ultralytics significa attingere a un ecosistema ben manutenuto con aggiornamenti frequenti e un vasto supporto della community.
Per i team aziendali, la piattaforma Ultralytics fornisce una soluzione end-to-end per l'annotazione dei dati, l'addestramento del modello e la distribuzione cloud senza interruzioni. Dall'esportazione dei tuoi pesi addestrati su CoreML o TensorRT, alla configurazione dell'ottimizzazione avanzata degli iperparametri, gli strumenti forniti assicurano che il ciclo di vita della tua AI sia il più snello possibile.