Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLOv10#

Il campo della computer vision in tempo reale ha assistito a una crescita esponenziale negli ultimi anni, con varie architetture che spingono i limiti di ciò che è possibile ottenere sull'hardware moderno. Nel valutare le architetture all'avanguardia, il confronto tra YOLOv5 e YOLOv10 evidenzia un significativo passo evolutivo nel dominio del rilevamento di oggetti. Questo approfondimento tecnico esplora i loro paradigmi architetturali, i compromessi in termini di prestazioni e come gli sviluppatori possono sfruttare questi strumenti negli ambienti di produzione.

Link to this sectionApprofondimento architettonico#

Comprendere le differenze strutturali tra questi modelli è fondamentale per distribuirli in modo efficiente nel mondo reale.

Link to this sectionUltralytics YOLOv5: Lo standard del settore#

Introdotto da Ultralytics, YOLOv5 è stato a lungo riconosciuto per il suo impareggiabile equilibrio tra velocità, precisione e accessibilità.

Scopri di più su YOLOv5

YOLOv5 si basa su un meccanismo di rilevamento basato su ancore combinato con una backbone CSPDarknet profondamente ottimizzata. Questa architettura si affida pesantemente a operazioni standard supportate da quasi tutti i motori di inferenza, il che la rende incredibilmente versatile. Il suo punto di forza principale risiede nell'Ultralytics Python SDK, che offre un'esperienza utente semplificata, una API semplice e una documentazione estesa. Inoltre, i requisiti di memoria inferiori di YOLOv5 rispetto ai modelli basati su Transformer significano che si addestra rapidamente su GPU di fascia consumer senza l'elevato sovraccarico di VRAM.

Link to this sectionYOLOv10: Far progredire il paradigma#

Sviluppato dai ricercatori della Tsinghua University, YOLOv10 mira ad affrontare specifici colli di bottiglia della latenza riscontrati nelle architetture precedenti.

Scopri di più su YOLOv10

La caratteristica distintiva di YOLOv10 è il suo design nativo NMS-free (Non-Maximum Suppression). Utilizzando assegnazioni doppie coerenti durante l'addestramento, il modello elimina la necessità di post-elaborazione NMS durante l'inferenza. Questa riduzione teorica della latenza è altamente vantaggiosa per le distribuzioni su hardware di fascia alta con potente accelerazione NVIDIA TensorRT, sebbene possa introdurre complessità strutturali per i dispositivi edge.

Vantaggio dell'ecosistema

Sebbene YOLOv10 offra interessanti novità architetturali, i modelli Ultralytics come YOLOv5 e il più recente YOLO26 sono supportati nativamente all'interno della Ultralytics Platform, offrendo un'efficienza di addestramento superiore, l'evoluzione automatica degli iperparametri e ampie opzioni di esportazione già pronte all'uso.

Link to this sectionAnalisi delle prestazioni#

Quando si confrontano questi modelli, l'equilibrio tra accuratezza (mAP) e costo computazionale (latenza e parametri) determina il miglior caso d'uso. Di seguito è riportato il confronto tecnico delle prestazioni sul dataset COCO.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv10 raggiunge chiaramente un mAP50-95 più elevato su scale dimensionali equivalenti, sfruttando il suo design del modello moderno guidato dall'efficienza-accuratezza. Tuttavia, YOLOv5 mantiene una latenza incredibilmente competitiva, specialmente nei livelli Nano e Small, rendendolo altamente affidabile per ambienti embedded vincolati come la linea NVIDIA Jetson o CPU standard tramite OpenVINO.

Link to this sectionMetodologie di Addestramento ed Ecosistema#

Il valore di un modello è profondamente legato all'ecosistema che lo circonda. Ultralytics mantiene un ecosistema eccezionalmente ben curato che supporta una gamma incredibilmente ampia di attività. Mentre YOLOv10 si concentra esclusivamente sul rilevamento di oggetti 2D, Ultralytics supporta nativamente segmentazione di istanze, classificazione di immagini, stima della posa e oriented bounding boxes (OBB).

Inoltre, l'addestramento di un modello Ultralytics richiede un sovraccarico di memoria significativamente inferiore rispetto ai metodi concorrenti basati su Transformer, mantenendo il ciclo di sviluppo rapido ed economico.

Link to this sectionEsecuzione fluida del codice#

L'addestramento, la validazione e l'esportazione dei modelli sono unificati sotto un'unica API. Puoi passare da un modello all'altro semplicemente modificando una stringa.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")

# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")

# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes PyTorch CUDA acceleration
    batch=16,
)

# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLOv5 e YOLOv10 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv5#

YOLOv5 è una scelta solida per:

  • Sistemi di produzione comprovati: Deployment esistenti in cui sono apprezzati la lunga storia di stabilità, l'ampia documentazione e il massiccio supporto della comunità di YOLOv5.
  • Addestramento con risorse limitate: Ambienti con risorse GPU limitate in cui la pipeline di addestramento efficiente e i minori requisiti di memoria di YOLOv5 sono vantaggiosi.
  • Ampio supporto di formati di esportazione: Progetti che richiedono il deployment su molti formati, inclusi ONNX, TensorRT, CoreML e TFLite.

Link to this sectionQuando scegliere YOLOv10#

YOLOv10 è consigliato per:

  • Rilevamento in tempo reale senza NMS: Applicazioni che traggono vantaggio dal rilevamento end-to-end senza Non-Maximum Suppression, riducendo la complessità di distribuzione.
  • Compromessi bilanciati tra velocità e precisione: Progetti che richiedono un ottimo equilibrio tra velocità di inferenza e precisione di rilevamento su diverse scale di modello.
  • Applicazioni a latenza costante: Scenari di distribuzione in cui tempi di inferenza prevedibili sono fondamentali, come nella robotica o nei sistemi autonomi.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl futuro: Ultralytics YOLO26#

Mentre YOLOv5 ha rivoluzionato l'accessibilità e YOLOv10 ha spinto i confini dell'architettura NMS-free, lo stato dell'arte continua a evolversi. Per i nuovi progetti, consigliamo vivamente il rivoluzionario Ultralytics YOLO26, rilasciato a gennaio 2026.

YOLO26 unisce l'affidabilità dell'ecosistema Ultralytics con progressi rivoluzionari:

  • Design end-to-end NMS-Free: Incorporando il paradigma NMS-free direttamente nel framework Ultralytics, YOLO26 semplifica la distribuzione e garantisce una latenza inferiore.
  • Inferenza su CPU fino al 43% più veloce: Con la rimozione della Distribution Focal Loss (DFL), YOLO26 è notevolmente più veloce sui dispositivi edge privi di GPU.
  • Ottimizzatore MuSGD: Ispirato dalle innovazioni nell'addestramento di LLM di Moonshot AI, l'ottimizzatore MuSGD offre una stabilità senza precedenti e una convergenza rapida.
  • ProgLoss + STAL: Queste nuove funzioni di perdita migliorano drasticamente il riconoscimento di piccoli oggetti, fondamentale per campi come l'immaginografia tramite droni e la robotica.

Puoi gestire, addestrare e distribuire YOLO26 direttamente tramite la Ultralytics Platform.

Link to this sectionConclusione#

La scelta tra YOLOv5 e YOLOv10 spesso dipende da vincoli specifici del progetto. YOLOv10 offre un eccellente mAP per ricercatori e applicazioni che sfruttano il throughput grezzo della GPU. Al contrario, YOLOv5 rimane un cavallo di battaglia affidabile e altamente compatibile per le distribuzioni standard.

Tuttavia, il campo della computer vision è dinamico. Per sfruttare il miglior equilibrio in assoluto tra prestazioni, versatilità e facilità d'uso, gli sviluppatori dovrebbero guardare a Ultralytics YOLO26. Esso racchiude la velocità dell'inferenza NMS-free con il robusto e ben documentato ecosistema Ultralytics, garantendo che le tue soluzioni di AI visiva siano a prova di futuro. Per casi d'uso specializzati, gli sviluppatori possono anche esplorare YOLO11 per la robustezza generale, o RT-DETR per la precisione basata su Transformer.

Collaboratori

Commenti