Ultralytics YOLO11

Panoramica

YOLO11 è stato rilasciato da Ultralytics il 10 settembre 2024, offrendo accuratezza, velocità ed efficienza eccellenti. Basandosi sugli impressionanti progressi delle precedenti versioni di YOLO, YOLO11 introduce miglioramenti significativi nell'architettura e nei metodi di addestramento, rendendolo una scelta versatile per un'ampia gamma di attività di computer vision. Per il modello Ultralytics più recente con inferenza end-to-end senza NMS e distribuzione edge ottimizzata, consulta YOLO26.

Grafici di confronto Ultralytics YOLO11

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM



Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Provalo sulla piattaforma Ultralytics

Esplora ed esegui i modelli YOLO11 direttamente su Ultralytics Platform.

Caratteristiche principali

  • Estrazione delle caratteristiche migliorata: YOLO11 impiega un'architettura di backbone e neck migliorata, che potenzia le capacità di estrazione delle caratteristiche per un rilevamento degli oggetti più preciso e prestazioni in attività complesse.
  • Ottimizzato per efficienza e velocità: YOLO11 introduce design architettonici raffinati e pipeline di addestramento ottimizzate, offrendo velocità di elaborazione più elevate e mantenendo un equilibrio ottimale tra accuratezza e prestazioni.
  • Maggiore accuratezza con meno parametri: Con i progressi nel design del modello, YOLO11m raggiunge una mean Average Precision (mAP) più elevata sul dataset COCO utilizzando il 22% di parametri in meno rispetto a YOLOv8m, rendendolo computazionalmente efficiente senza compromettere l'accuratezza.
  • Adattabilità attraverso gli ambienti: YOLO11 può essere distribuito senza problemi in vari ambienti, inclusi dispositivi edge, piattaforme cloud e sistemi che supportano NVIDIA GPU, garantendo la massima flessibilità.
  • Ampia gamma di attività supportate: Che si tratti di rilevamento oggetti, segmentazione di istanze, classificazione di immagini, stima della posa o rilevamento di oggetti orientati (OBB), YOLO11 è progettato per soddisfare una serie diversificata di sfide di computer vision.

Attività e modalità supportate

YOLO11 si basa sulla versatile gamma di modelli stabilita dai precedenti rilasci di Ultralytics YOLO, offrendo un supporto migliorato per diverse attività di computer vision:

ModelloNomi fileAttivitàInferenza (Inference)ValidazioneAddestramentoExport
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.ptRilevamento
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptSegmentazione delle istanze
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptPosa/Punti chiave
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.ptRilevamento orientato
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.ptClassificazione

Questa tabella fornisce una panoramica delle varianti del modello YOLO11, illustrando la loro applicabilità in attività specifiche e la compatibilità con modalità operative come Inferenza, Validazione, Addestramento ed Esportazione. Questa flessibilità rende YOLO11 adatto a una vasta gamma di applicazioni nella computer vision, dal rilevamento in tempo reale a complesse attività di segmentazione.

Metriche delle prestazioni

Prestazioni

Consulta i documenti sul rilevamento per esempi di utilizzo con questi modelli addestrati su COCO, che includono 80 classi pre-addestrate.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOP
(B)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66.5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

Esempi di utilizzo

Questa sezione fornisce semplici esempi di addestramento e inferenza con YOLO11. Per la documentazione completa su queste e altre modalità, consulta le pagine della documentazione relative a Predict, Train, Val ed Export.

Nota che l'esempio seguente è per i modelli YOLO11 Detect per il rilevamento di oggetti. Per ulteriori attività supportate, consulta la documentazione su Segment, Classify, OBB e Pose.

Esempio

I modelli preaddestrati PyTorch *.pt, così come i file di configurazione *.yaml, possono essere passati alla classe YOLO() per creare un'istanza del modello in Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Citazioni e ringraziamenti

Pubblicazione di Ultralytics YOLO11

Ultralytics non ha pubblicato un documento di ricerca formale per YOLO11 a causa della natura in rapida evoluzione dei modelli. Ci concentriamo sull'avanzamento della tecnologia e sul renderla più facile da usare, piuttosto che sulla produzione di documentazione statica. Per le informazioni più aggiornate sull'architettura, le funzionalità e l'utilizzo di YOLO, fai riferimento al nostro repository GitHub e alla documentazione.

Se utilizzi YOLO11 o qualsiasi altro software da questo repository nel tuo lavoro, ti preghiamo di citarlo utilizzando il seguente formato:

Citazione
@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Tieni presente che il DOI è in attesa e verrà aggiunto alla citazione non appena sarà disponibile. I modelli YOLO11 sono forniti con licenze AGPL-3.0 e Enterprise.

FAQ

Quali sono i miglioramenti chiave in Ultralytics YOLO11 rispetto a YOLOv8?

Ultralytics YOLO11 introduce diversi progressi significativi rispetto a YOLOv8. I miglioramenti chiave includono:

  • Estrazione delle caratteristiche migliorata: YOLO11 impiega un'architettura backbone e neck migliorata, potenziando le capacità di estrazione delle caratteristiche per un rilevamento degli oggetti più preciso.
  • Efficienza e velocità ottimizzate: Design architetturali raffinati e pipeline di addestramento ottimizzate offrono velocità di elaborazione più elevate, mantenendo al contempo un equilibrio tra precisione e prestazioni.
  • Maggiore precisione con meno parametri: YOLO11m raggiunge una media di Precision (mAP) più elevata sul dataset COCO con il 22% di parametri in meno rispetto a YOLOv8m, rendendolo computazionalmente efficiente senza compromettere la precisione.
  • Adattabilità in tutti gli ambienti: YOLO11 può essere distribuito in vari ambienti, inclusi dispositivi edge, piattaforme cloud e sistemi che supportano GPU NVIDIA.
  • Ampia gamma di attività supportate: YOLO11 supporta diverse attività di computer vision come il rilevamento di oggetti, la segmentazione di istanze, la classificazione di immagini, la stima della posa e il rilevamento orientato di oggetti (OBB).

Come addestro un modello YOLO11 per il rilevamento di oggetti?

L'addestramento di un modello YOLO11 per il rilevamento di oggetti può essere effettuato utilizzando Python o comandi CLI. Di seguito sono riportati esempi per entrambi i metodi:

Esempio
from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Per istruzioni più dettagliate, fai riferimento alla documentazione Train.

Quali attività possono eseguire i modelli YOLO11?

I modelli YOLO11 sono versatili e supportano una vasta gamma di attività di computer vision, tra cui:

  • Rilevamento di oggetti: Identificare e localizzare oggetti all'interno di un'immagine.
  • Segmentazione di istanze: Rilevare oggetti e delineare i loro confini.
  • Classificazione di immagini: Categorizzare le immagini in classi predefinite.
  • Stima della posa: Rilevare e tracciare punti chiave sui corpi umani.
  • Rilevamento orientato di oggetti (OBB): Rilevare oggetti con rotazione per una maggiore precisione.

Per ulteriori informazioni su ciascuna attività, consulta la documentazione su Detection, Instance Segmentation, Classification, Pose Estimation e Oriented Detection.

Come fa YOLO11 a ottenere una maggiore precisione con meno parametri?

YOLO11 ottiene una maggiore precisione con meno parametri grazie a progressi nella progettazione del modello e a tecniche di ottimizzazione. L'architettura migliorata consente un'estrazione e un'elaborazione efficienti delle caratteristiche, risultando in una media di Precision (mAP) più elevata su dataset come COCO, pur utilizzando il 22% di parametri in meno rispetto a YOLOv8m. Questo rende YOLO11 computazionalmente efficiente senza compromettere la precisione, rendendolo adatto alla distribuzione su dispositivi con risorse limitate.

YOLO11 può essere distribuito su dispositivi edge?

Sì, YOLO11 è progettato per l'adattabilità in vari ambienti, inclusi i dispositivi edge. La sua architettura ottimizzata e le capacità di elaborazione efficienti lo rendono adatto alla distribuzione su dispositivi edge, piattaforme cloud e sistemi che supportano GPU NVIDIA. Questa flessibilità garantisce che YOLO11 possa essere utilizzato in diverse applicazioni, dal rilevamento in tempo reale su dispositivi mobili a complesse attività di segmentazione in ambienti cloud. Per ulteriori dettagli sulle opzioni di distribuzione, fai riferimento alla documentazione Export.

Commenti