Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 contro DAMO-YOLO#

Il panorama del rilevamento di oggetti in tempo reale è in continua evoluzione, con ricercatori e ingegneri che si sforzano di trovare il bilanciamento ottimale tra velocità e precisione. In questo confronto tecnico, analizzeremo a fondo due architetture degne di nota del 2022: YOLOv7 e DAMO-YOLO. Entrambi i modelli hanno introdotto concetti innovativi nella comunità della computer vision, affrontando diverse sfide nell'addestramento dei modelli, nella progettazione dell'architettura e nel deployment.

Link to this sectionBackground dei modelli e dettagli tecnici#

Prima di approfondire le loro architetture, è essenziale comprendere le origini di questi due modelli. Entrambi sono stati sviluppati da gruppi di ricerca leader e hanno introdotto metodologie avanzate per spingere i confini del rilevamento di oggetti in tempo reale.

Link to this sectionDettagli su YOLOv7#

Sviluppato come prosecuzione della famiglia YOLO, YOLOv7 ha introdotto il concetto di "bag-of-freebies" addestrabili per migliorare significativamente la precisione senza aumentare il costo dell'inferenza.

Scopri di più su YOLOv7

Link to this sectionDettagli di DAMO-YOLO#

Creato dai ricercatori di Alibaba Group, DAMO-YOLO si è concentrato pesantemente sulla Neural Architecture Search (NAS) e sulla distillazione avanzata della conoscenza per costruire modelli altamente efficienti per hardware diversificato.

Scopri di più su DAMO-YOLO

Link to this sectionInnovazioni architettoniche#

Link to this sectionYOLOv7: Analisi del percorso del gradiente e ri-parametrizzazione#

YOLOv7 si concentra pesantemente sulle Extended Efficient Layer Aggregation Networks (E-ELAN). Gli autori hanno progettato E-ELAN analizzando i percorsi del gradiente della rete, assicurando che la rete possa continuare ad apprendere senza degradare il percorso originale del gradiente. Inoltre, YOLOv7 utilizza efficacemente la ri-parametrizzazione del modello durante l'inferenza, fondendo perfettamente i livelli per ridurre i FLOPs e accelerare i tempi di esecuzione. Questo lo rende altamente capace per l'inferenza in tempo reale sulle moderne GPU.

Link to this sectionDAMO-YOLO: Neural Architecture Search e RepGFPN#

DAMO-YOLO diverge sfruttando pesantemente la Neural Architecture Search (NAS) sotto vincoli di latenza. Utilizza un framework chiamato MAE-NAS per scoprire backbone ottimali su misura per hardware specifici, come dispositivi mobili o acceleratori edge dedicati. Per il suo neck, introduce un'efficiente RepGFPN (Rep-parameterized Generalized Feature Pyramid Network) e impiega un design ZeroHead per ridurre al minimo il carico computazionale nelle teste di predizione.

Differenze di distillazione

Mentre YOLOv7 si affida a forti ottimizzazioni architettoniche intrinseche, DAMO-YOLO dipende pesantemente da un complesso processo di distillazione della conoscenza multi-stadio. Richiede l'addestramento di un grande modello teacher per distillare la conoscenza in un modello student più piccolo, il che può essere computazionalmente costoso durante la fase di addestramento.

Link to this sectionConfronto tra prestazioni e metriche#

Quando si confrontano questi modelli, è fondamentale guardare alla mAP (Mean Average Precision), alla velocità di inferenza e alla complessità del modello.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

La tabella sopra dimostra che YOLOv7 scala bene in domini ad alta precisione (YOLOv7x), mentre DAMO-YOLO fornisce modelli tiny altamente ottimizzati per ambienti vincolati.

Link to this sectionEfficienza di addestramento e requisiti di memoria#

Una distinzione importante tra le due architetture risiede nelle loro metodologie di addestramento. La dipendenza di DAMO-YOLO dalla distillazione significa che addestrare un nuovo modello da zero o effettuare il fine-tuning su un dataset di computer vision personalizzato richiede spesso significativamente più VRAM e tempo di calcolo GPU.

Al contrario, i modelli integrati nell'ecosistema Ultralytics, come YOLOv7 e le versioni successive, sono pesantemente ottimizzati per i requisiti di memoria. Consentono agli sviluppatori di utilizzare batch size maggiori su hardware consumer senza riscontrare errori di memoria insufficiente, semplificando il processo di tracciamento degli esperimenti e di iterazione.

Link to this sectionIl vantaggio di Ultralytics#

Sebbene sia YOLOv7 che DAMO-YOLO offrano caratteristiche interessanti, il deployment dei modelli all'interno dell'ecosistema Ultralytics offre un'esperienza per gli sviluppatori senza pari.

  • Facilità d'uso: Il pacchetto Python di Ultralytics offre un'API unificata e semplice. Puoi passare rapidamente da un'architettura di modello all'altra, avviare cicli di addestramento o eseguire l'inferenza con poche righe di codice.
  • Ecosistema ben mantenuto: Ultralytics fornisce aggiornamenti frequenti, garantendo la compatibilità nativa con le ultime versioni di PyTorch e i driver CUDA. Semplifica inoltre l'esportazione dei modelli in formati come ONNX, TensorRT e OpenVINO.
  • Versatilità: A differenza di DAMO-YOLO, che è rigorosamente un rilevatore di oggetti, l'ecosistema Ultralytics supporta nativamente svariate attività. I modelli della famiglia Ultralytics possono eseguire il rilevamento standard di bounding box, stima della posa, segmentazione di istanze e Oriented Bounding Boxes (OBB).

Link to this sectionEsempio di codice: Iniziare rapidamente#

Ecco quanto è facile caricare, addestrare ed eseguire l'inferenza utilizzando i modelli Ultralytics:

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")
Esportazione dei modelli

Con Ultralytics, l'esportazione dei tuoi pesi addestrati in vari formati accelerati dall'hardware (come TensorRT o CoreML) viene gestita tramite un singolo argomento nel comando di esportazione, risparmiando ore di complesse configurazioni di script.

Link to this sectionLa prossima generazione: YOLO26#

Mentre YOLOv7 rimane una solida architettura legacy, il settore ha fatto rapidi progressi. Per i nuovi deployment, Ultralytics YOLO26 (rilasciato a gennaio 2026) è lo standard consigliato, superando le generazioni precedenti in quasi tutte le metriche.

  • Design end-to-end senza NMS: Introdotto per la prima volta in YOLOv10, YOLO26 elimina nativamente il post-processing Non-Maximum Suppression (NMS). Questo garantisce un'inferenza deterministica a latenza ultra-bassa, critica per la robotica e le tecnologie di guida autonoma.
  • Ottimizzatore MuSGD: Ispirato alle tecniche avanzate di addestramento LLM (come Kimi K2 di Moonshot AI), questo ottimizzatore ibrido fonde SGD e Muon per offrire un addestramento altamente stabile e una convergenza più rapida su tutti i dataset.
  • Inferenza CPU fino al 43% più veloce: Rimuovendo strategicamente la Distribution Focal Loss (DFL), YOLO26 aumenta significativamente le prestazioni su piattaforme di edge computing e CPU.
  • ProgLoss + STAL: Queste funzioni di loss avanzate producono miglioramenti sostanziali nel rilevamento di oggetti piccoli, rendendo YOLO26 eccezionalmente adatto per l'immagineria aerea e la sorveglianza dettagliata.

Scopri di più su YOLO26

Link to this sectionCasi d'uso ideali#

Link to this sectionQuando scegliere DAMO-YOLO#

  • Ricerca accademica nel NAS: Se la tua organizzazione è fortemente impegnata nello studio delle metodologie di Neural Architecture Search.
  • Latenza iper-vincolata su hardware specifico: Se hai le risorse per eseguire ricerche NAS esaustive per trovare un backbone su misura per un chip acceleratore AI personalizzato.

Link to this sectionQuando scegliere YOLOv7#

  • Pipeline GPU esistenti: Per i team che mantengono pipeline di produzione legacy profondamente ottimizzate attorno alla specifica architettura E-ELAN di YOLOv7 su hardware NVIDIA di fascia alta.

Link to this sectionPerché migrare ai moderni modelli Ultralytics (YOLO11 / YOLO26)#

Per la stragrande maggioranza delle applicazioni aziendali—dall'analisi del retail e la produzione intelligente all'assistenza sanitaria—i moderni modelli Ultralytics non hanno eguali. L'integrazione con la Piattaforma Ultralytics fornisce una pipeline ML completa, offrendo facilità d'uso, documentazione superiore, solido supporto della comunità e versatilità multi-task. Che tu stia tracciando l'inventario su un Raspberry Pi o eseguendo analisi pesanti nel cloud, modelli come YOLO26 offrono l'equilibrio prestazionale ideale per il futuro della computer vision.

Commenti