Link to this sectionDataset ImageNet#
ImageNet è un database su larga scala di immagini annotate, progettato per l'uso nella ricerca sul riconoscimento visivo degli oggetti. Contiene oltre 14 milioni di immagini, ciascuna annotata utilizzando i synset di WordNet, il che lo rende una delle risorse più estese disponibili per l'addestramento di modelli di deep learning in attività di computer vision.
Link to this sectionModelli preaddestrati ImageNet#
| Modello | dimensione (pixel) | acc top1 | acc top5 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | params (M) | FLOPs (B) a 224 |
|---|---|---|---|---|---|---|---|
| YOLO26n-cls | 224 | 71.4 | 90.1 | 5.0 ± 0.3 | 1.1 ± 0.0 | 2.8 | 0.5 |
| YOLO26s-cls | 224 | 76.0 | 92.9 | 7.9 ± 0.2 | 1.3 ± 0.0 | 6.7 | 1.6 |
| YOLO26m-cls | 224 | 78.1 | 94.2 | 17.2 ± 0.4 | 2.0 ± 0.0 | 11.6 | 4.9 |
| YOLO26l-cls | 224 | 79.0 | 94.6 | 23.2 ± 0.3 | 2.8 ± 0.0 | 14.1 | 6.2 |
| YOLO26x-cls | 224 | 79.9 | 95.0 | 41.4 ± 0.9 | 3.8 ± 0.0 | 29.6 | 13.6 |
Link to this sectionCaratteristiche principali#
- ImageNet contiene oltre 14 milioni di immagini ad alta risoluzione che coprono migliaia di categorie di oggetti.
- Il dataset è organizzato secondo la gerarchia di WordNet, in cui ogni synset rappresenta una categoria.
- ImageNet è ampiamente utilizzato per l'addestramento e il benchmarking nel campo della computer vision, in particolare per attività di image classification e object detection.
- L'annuale ImageNet Large Scale Visual Recognition Challenge (ILSVRC) è stato fondamentale per far avanzare la ricerca nella computer vision.
Link to this sectionStruttura del dataset#
Il dataset ImageNet è organizzato utilizzando la gerarchia di WordNet. Ogni nodo nella gerarchia rappresenta una categoria e ogni categoria è descritta da un synset (una raccolta di termini sinonimi). Le immagini in ImageNet sono annotate con uno o più synset, fornendo una ricca risorsa per l'addestramento di modelli a riconoscere vari oggetti e le loro relazioni.
Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)#
L'annuale ImageNet Large Scale Visual Recognition Challenge (ILSVRC) è stato un evento importante nel campo della computer vision. Ha fornito una piattaforma per ricercatori e sviluppatori per valutare i propri algoritmi e modelli su un dataset su larga scala con metriche di valutazione standardizzate. L'ILSVRC ha portato a significativi progressi nello sviluppo di modelli di deep learning per l'image classification, l'object detection e altre attività di computer vision.
Link to this sectionApplicazioni#
Il dataset ImageNet è ampiamente utilizzato per addestrare e valutare modelli di deep learning in varie attività di computer vision, come l'image classification, l'object detection e l'object localization. Alcune famose architetture di deep learning, come AlexNet, VGG e ResNet, sono state sviluppate e sottoposte a benchmark utilizzando il dataset ImageNet.
Link to this sectionUtilizzo#
Per addestrare un modello di deep learning sul dataset ImageNet per 100 epoch con una dimensione dell'immagine di 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Training del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)Link to this sectionEsempi di immagini e annotazioni#
Il dataset ImageNet contiene immagini ad alta risoluzione che coprono migliaia di categorie di oggetti, fornendo un dataset diversificato ed esteso per l'addestramento e la valutazione di modelli di computer vision. Ecco alcuni esempi di immagini dal dataset:

L'esempio mostra la varietà e la complessità delle immagini nel dataset ImageNet, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli di computer vision robusti.
Link to this sectionCitazioni e Riconoscimenti#
Se utilizzi il dataset ImageNet nella tua attività di ricerca o sviluppo, ti preghiamo di citare il seguente documento:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}Desideriamo ringraziare il team di ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per aver creato e mantenuto il dataset ImageNet come risorsa preziosa per la comunità di ricerca di machine learning e computer vision. Per ulteriori informazioni sul dataset ImageNet e sui suoi creatori, visita il sito web di ImageNet.
Link to this sectionFAQ#
Link to this sectionCos'è il dataset ImageNet e come viene utilizzato nella computer vision?#
Il dataset ImageNet è un database su larga scala costituito da oltre 14 milioni di immagini ad alta risoluzione categorizzate utilizzando i synset di WordNet. È ampiamente utilizzato nella ricerca sul riconoscimento visivo degli oggetti, inclusa l'image classification e l'object detection. Le annotazioni e l'enorme volume del dataset forniscono una ricca risorsa per l'addestramento di modelli di deep learning. In particolare, modelli come AlexNet, VGG e ResNet sono stati addestrati e sottoposti a benchmark utilizzando ImageNet, dimostrando il suo ruolo nel far avanzare la computer vision.
Link to this sectionCome posso utilizzare un modello YOLO preaddestrato per l'image classification sul dataset ImageNet?#
Per utilizzare un modello Ultralytics YOLO preaddestrato per l'image classification sul dataset ImageNet, segui questi passaggi:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)Per istruzioni di addestramento più approfondite, fai riferimento alla nostra pagina di Training.
Link to this sectionPerché dovrei utilizzare i modelli preaddestrati Ultralytics YOLO26 per i miei progetti sul dataset ImageNet?#
I modelli preaddestrati Ultralytics YOLO26 offrono prestazioni all'avanguardia in termini di velocità e accuratezza per varie attività di computer vision. Ad esempio, il modello YOLO26n-cls, con un'accuratezza top-1 del 71,4% e un'accuratezza top-5 del 90,1%, è ottimizzato per applicazioni in tempo reale. I modelli preaddestrati riducono le risorse computazionali necessarie per l'addestramento da zero e accelerano i cicli di sviluppo. Scopri di più sulle metriche di prestazione dei modelli YOLO26 nella sezione Modelli preaddestrati ImageNet.
Link to this sectionCom'è strutturato il dataset ImageNet e perché è importante?#
Il dataset ImageNet è organizzato utilizzando la gerarchia di WordNet, in cui ogni nodo nella gerarchia rappresenta una categoria descritta da un synset (una raccolta di termini sinonimi). Questa struttura consente annotazioni dettagliate, rendendolo ideale per l'addestramento di modelli a riconoscere un'ampia varietà di oggetti. La diversità e la ricchezza di annotazioni di ImageNet lo rendono un dataset prezioso per lo sviluppo di modelli di deep learning robusti e generalizzabili. Maggiori informazioni su questa organizzazione sono disponibili nella sezione Struttura del dataset.
Link to this sectionChe ruolo svolge la ImageNet Large Scale Visual Recognition Challenge (ILSVRC) nella computer vision?#
L'annuale ImageNet Large Scale Visual Recognition Challenge (ILSVRC) è stata fondamentale nel guidare i progressi nella computer vision fornendo una piattaforma competitiva per la valutazione di algoritmi su un dataset standardizzato su larga scala. Offre metriche di valutazione standardizzate, favorendo l'innovazione e lo sviluppo in aree come l'image classification, l'object detection e l'image segmentation. La sfida ha continuamente spinto i confini di ciò che è possibile fare con le tecnologie di deep learning e computer vision.