Vai al contenuto

Ultralytics YOLO11

Panoramica

YOLO11 è l'ultima iterazione della serie Ultralytics YOLO di rilevatori di oggetti in tempo reale, che ridefinisce ciò che è possibile con accuratezza, velocità ed efficienza all'avanguardia. Basandosi sugli impressionanti progressi delle precedenti versioni di YOLO, YOLO11 introduce miglioramenti significativi nell'architettura e nei metodi di addestramento, rendendolo una scelta versatile per un'ampia gamma di attività di computer vision.

Grafici comparativi di Ultralytics YOLO11

Ultralytics YOLO11 🚀 Podcast generato da NotebookLM



Guarda: Come utilizzare Ultralytics YOLO11 per il rilevamento e il tracciamento di oggetti | Come effettuare il benchmark | YOLO11 RILASCIATO🚀

Caratteristiche principali

  • Estrazione di feature migliorata: YOLO11 impiega un'architettura backbone e neck migliorata, che aumenta le capacità di estrazione di feature per un rilevamento di oggetti più preciso e prestazioni di attività complesse.
  • Ottimizzato per Efficienza e Velocità: YOLO11 introduce design architetturali perfezionati e pipeline di training ottimizzate, offrendo velocità di elaborazione più elevate e mantenendo un equilibrio ottimale tra precisione e prestazioni.
  • Maggiore accuratezza con meno parametri: Grazie ai progressi nella progettazione del modello, YOLO11m raggiunge una precisione media media (mAP) più elevata sul set di dati COCO pur utilizzando il 22% in meno di parametri rispetto a YOLOv8m, rendendolo computazionalmente efficiente senza compromettere l'accuratezza.
  • Adattabilità tra ambienti: YOLO11 può essere implementato senza problemi in vari ambienti, inclusi dispositivi edge, piattaforme cloud e sistemi che supportano GPU NVIDIA, garantendo la massima flessibilità.
  • Ampia gamma di attività supportate: Che si tratti di rilevamento oggetti, segmentazione di istanze, classificazione di immagini, stima della posa o rilevamento di oggetti orientati (OBB), YOLO11 è progettato per soddisfare una serie diversificata di sfide di computer vision.

Attività e modalità supportate

YOLO11 si basa sulla versatile gamma di modelli stabilita dalle precedenti versioni di Ultralytics YOLO, offrendo un supporto avanzato per varie attività di computer vision:

ModelloNomi dei fileTaskInferenzaValidazioneTrainingEsportazione
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.ptRilevamento
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptSegmentazione delle istanze
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptPosa/Punti chiave
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.ptRilevamento orientato
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.ptClassificazione

Questa tabella fornisce una panoramica delle varianti del modello YOLO11, mostrando la loro applicabilità in attività specifiche e la compatibilità con modalità operative come Inferenza, Validazione, Addestramento ed Esportazione. Questa flessibilità rende YOLO11 adatto a un'ampia gamma di applicazioni nella visione artificiale, dal rilevamento in tempo reale a complesse attività di segmentazione.

Metriche di performance

Prestazioni

Consulta la documentazione sul Detection per esempi di utilizzo con questi modelli addestrati su COCO, che includono 80 classi pre-addestrate.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66.5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

Consulta la documentazione sulla Segmentazione per esempi di utilizzo con questi modelli addestrati su COCO, che includono 80 classi pre-addestrate.

Modellodimensione
(pixel)
mAPbox
50-95
mAPmask
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO11n-seg64038.932.065.9 ± 1.11.8 ± 0.02.99.7
YOLO11s-seg64046.637.8117.6 ± 4.92.9 ± 0.010.133.0
YOLO11m-seg64051.541.5281.6 ± 1.26.3 ± 0.122.4113.2
YOLO11l-seg64053.442.9344.2 ± 3.27.8 ± 0.227.6132.2
YOLO11x-seg64054.743.8664.5 ± 3.215.8 ± 0.762.1296.4

Consulta la documentazione sulla classificazione per esempi di utilizzo con questi modelli addestrati su ImageNet, che includono 1000 classi pre-addestrate.

Modellodimensione
(pixel)
acc
top1
acc
top5
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B) a 224
YOLO11n-cls22470.089.45.0 ± 0.31.1 ± 0.02.80.5
YOLO11s-cls22475.492.77.9 ± 0.21.3 ± 0.06.71.6
YOLO11m-cls22477.393.917.2 ± 0.42.0 ± 0.011.64.9
YOLO11l-cls22478.394.323.2 ± 0.32.8 ± 0.014.16.2
YOLO11x-cls22479.594.941.4 ± 0.93.8 ± 0.029.613.6

Consulta la documentazione sulla stima della posa per esempi di utilizzo con questi modelli addestrati su COCO, che includono 1 classe pre-addestrata, 'person'.

Modellodimensione
(pixel)
mAPpose
50-95
mAPpose
50
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO11n-pose64050.081.052.4 ± 0.51.7 ± 0.02.97.4
YOLO11s-pose64058.986.390.5 ± 0.62.6 ± 0.09.923.1
YOLO11m-pose64064.989.4187.3 ± 0.84.9 ± 0.120.971.4
YOLO11l-pose64066.189.9247.7 ± 1.16.4 ± 0.126.190.3
YOLO11x-pose64069.591.1488.0 ± 13.912.1 ± 0.258.8202.8

Consulta la documentazione sul rilevamento orientato per esempi di utilizzo con questi modelli addestrati su DOTAv1, che include 15 classi pre-addestrate.

Modellodimensione
(pixel)
mAPtest
50
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO11n-obb102478.4117.6 ± 0.84.4 ± 0.02.716.8
YOLO11s-obb102479.5219.4 ± 4.05.1 ± 0.09.757.1
YOLO11m-obb102480.9562,8 ± 2,910.1 ± 0.420.9182.8
YOLO11l-obb102481.0712.5 ± 5.013.5 ± 0.626.1231.2
YOLO11x-obb102481.31408.6 ± 7.728.6 ± 1.058.8519.1

Esempi di utilizzo

Questa sezione fornisce semplici esempi di addestramento e inferenza YOLO11. Per la documentazione completa su queste e altre modalità, consulta le pagine della documentazione Predict, Train, Val ed Export.

Si noti che l'esempio seguente è per i modelli YOLO11 Detect per il rilevamento di oggetti. Per ulteriori attività supportate, consultare i documenti Segment, Classify, OBB e Pose.

Esempio

PyTorch pre-addestrato *.pt modelli, così come la configurazione *.yaml file possono essere passati alla YOLO() classe per creare un'istanza del modello in Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Sono disponibili comandi CLI per eseguire direttamente i modelli:

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO11n model and run inference on the 'bus.jpg' image
yolo predict model=yolo11n.pt source=path/to/bus.jpg

Citazioni e ringraziamenti

Pubblicazione Ultralytics YOLO11

Ultralytics non ha pubblicato un documento di ricerca formale per YOLO11 a causa della rapida evoluzione dei modelli. Ci concentriamo sul progresso della tecnologia e sul renderla più facile da usare, piuttosto che sulla produzione di documentazione statica. Per le informazioni più aggiornate sull'architettura, le caratteristiche e l'utilizzo di YOLO, fare riferimento al nostro repository GitHub e alla documentazione.

Se utilizzi YOLO11 o qualsiasi altro software da questo repository nel tuo lavoro, citalo utilizzando il seguente formato:

@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Si prega di notare che il DOI è in sospeso e verrà aggiunto alla citazione non appena sarà disponibile. I modelli YOLO11 sono forniti con licenze AGPL-3.0 ed Enterprise.

FAQ

Quali sono i principali miglioramenti in Ultralytics YOLO11 rispetto alle versioni precedenti?

Ultralytics YOLO11 introduce diversi progressi significativi rispetto ai suoi predecessori. I miglioramenti chiave includono:

  • Estrazione di Feature Migliorata: YOLO11 impiega un'architettura backbone e neck migliorata, potenziando le capacità di estrazione di feature per un rilevamento di oggetti più preciso.
  • Efficienza e Velocità Ottimizzate: Design architetturali perfezionati e pipeline di training ottimizzate offrono velocità di elaborazione più elevate, mantenendo al contempo un equilibrio tra precisione e prestazioni.
  • Maggiore accuratezza con meno parametri: YOLO11m raggiunge una media di precisione (mAP) più elevata sul set di dati COCO con il 22% in meno di parametri rispetto a YOLOv8m, rendendolo computazionalmente efficiente senza compromettere l'accuratezza.
  • Adattabilità tra ambienti: YOLO11 può essere implementato in vari ambienti, inclusi dispositivi edge, piattaforme cloud e sistemi che supportano GPU NVIDIA.
  • Ampia gamma di attività supportate: YOLO11 supporta diverse attività di computer vision come il rilevamento di oggetti, la segmentazione di istanze, la classificazione di immagini, la stima della posa e il rilevamento di oggetti orientati (OBB).

Come posso addestrare un modello YOLO11 per il rilevamento di oggetti?

L'addestramento di un modello YOLO11 per l'object detection può essere eseguito utilizzando comandi Python o CLI. Di seguito sono riportati esempi per entrambi i metodi:

Esempio

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

Per istruzioni più dettagliate, fare riferimento alla documentazione Addestramento.

Quali task possono eseguire i modelli YOLO11?

I modelli YOLO11 sono versatili e supportano un'ampia gamma di attività di computer vision, tra cui:

  • Rilevamento di Oggetti: Identificazione e localizzazione di oggetti all'interno di un'immagine.
  • Segmentazione di istanza: Rilevamento di oggetti e delineazione dei loro confini.
  • Classificazione delle immagini: Categorizzazione delle immagini in classi predefinite.
  • Stima della posa: Rilevamento e tracciamento dei punti chiave sui corpi umani.
  • Object Detection Orientato (OBB): Rilevamento di oggetti con rotazione per una maggiore precisione.

Per maggiori informazioni su ciascuna attività, consulta la documentazione relativa a Rilevamento, Segmentazione delle istanze, Classificazione, Stima della posa e Rilevamento orientato.

In che modo YOLO11 raggiunge una maggiore accuratezza con meno parametri?

YOLO11 raggiunge una maggiore accuratezza con meno parametri grazie ai progressi nella progettazione del modello e nelle tecniche di ottimizzazione. L'architettura migliorata consente un'estrazione e un'elaborazione efficienti delle feature, ottenendo una media di precisione media (mAP) più elevata su dataset come COCO, utilizzando il 22% in meno di parametri rispetto a YOLOv8m. Ciò rende YOLO11 efficiente dal punto di vista computazionale senza compromettere l'accuratezza, rendendolo adatto per l'implementazione su dispositivi con risorse limitate.

YOLO11 può essere implementato su dispositivi edge?

Sì, YOLO11 è progettato per l'adattabilità in vari ambienti, inclusi i dispositivi edge. La sua architettura ottimizzata e le efficienti capacità di elaborazione lo rendono adatto per la distribuzione su dispositivi edge, piattaforme cloud e sistemi che supportano GPU NVIDIA. Questa flessibilità garantisce che YOLO11 possa essere utilizzato in diverse applicazioni, dal rilevamento in tempo reale su dispositivi mobili a complesse attività di segmentazione in ambienti cloud. Per maggiori dettagli sulle opzioni di implementazione, fare riferimento alla documentazione di Esportazione.



📅 Creato 1 anno fa ✏️ Aggiornato 17 giorni fa
glenn-jocherRizwanMunawarpderrengerY-T-GLaughing-qambitious-octopus

Commenti