Link to this sectionDataset ImageNet#

Name: Dataset ImageNet per la classificazione di immagini
Creator: ImageNet
License: https://www.image-net.org/download.php
Keywords: ImageNet, ILSVRC-2012, classificazione di immagini, deep learning, computer vision, modelli preaddestrati, YOLO, dataset, WordNet

Il dataset Ultralytics ImageNet (data="imagenet") è il subset ImageNet-1k / ILSVRC-2012 utilizzato per addestrare e sottoporre a benchmark modelli di classificazione di immagini. Contiene 1.000 classi di oggetti con 1.281.167 immagini di addestramento e 50.000 immagini di validazione a una dimensione di 224x224, e richiede il download di circa 144 GB di dati. Il database ImageNet più ampio è molto più vasto — oltre 14 milioni di immagini ad alta risoluzione annotate con synset WordNet in oltre 20.000 categorie — ma Ultralytics esegue l'addestramento sul subset standardizzato a 1.000 classi ILSVRC che è diventato il benchmark de facto per il deep learning nella computer vision.

Link to this sectionModelli preaddestrati ImageNet#

Modello	dimensione ^(pixel)	acc ^top1	acc ^top5	Velocità ^{CPU ONNX (ms)}	Velocità ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^{(B) a 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79.9	95.0	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

Link to this sectionCaratteristiche principali#

Il dataset Ultralytics imagenet fornisce 1.000 classi con 1.281.167 immagini di addestramento e 50.000 di validazione (ILSVRC-2012), il benchmark di pre-addestramento standard per la classificazione di immagini.
Le classi sono organizzate secondo la gerarchia WordNet, dove ogni classe corrisponde a un synset (un insieme di termini sinonimi).
Le immagini vengono addestrate a 224x224 e il dataset completo è un download voluminoso di ~144 GB.
L'annuale ImageNet Large Scale Visual Recognition Challenge (ILSVRC) è stato fondamentale per far avanzare la ricerca nella computer vision.

Link to this sectionStruttura del dataset#

Il dataset Ultralytics ImageNet utilizza lo split ILSVRC-2012:

Split	Immagini	Classi
Addestramento	1.281.167	1.000
Validazione	50.000	1.000

Le immagini sono archiviate in cartelle per classe denominate tramite ID synset WordNet (ad esempio, n01440764), il layout che l'addestramento alla classificazione di Ultralytics si aspetta. Ognuna delle 1.000 classi mappa su un synset WordNet e non esiste uno split di test separato, quindi il set di validazione da 50.000 immagini viene utilizzato per misurare l'accuratezza.

Dimensioni del download

ImageNet-1k è un download di ~144 GB, quindi assicurati di avere abbastanza spazio su disco prima dell'addestramento. Per esperimenti rapidi, i subset più piccoli ImageNette e ImageNet10 utilizzano lo stesso formato di cartella e richiedono una frazione del tempo per l'addestramento.

Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)#

L'annuale ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ha permesso ai ricercatori di sottoporre a benchmark gli algoritmi su un dataset standardizzato e su larga scala con metriche di valutazione coerenti. Ha guidato progressi significativi nel deep learning per la classificazione di immagini, il rilevamento di oggetti e altre attività di visione — in particolare la vittoria di AlexNet nel 2012, che ha contribuito a lanciare l'era moderna del deep learning.

Link to this sectionApplicazioni#

Il dataset ImageNet è ampiamente utilizzato per addestrare e valutare modelli di deep learning per la classificazione di immagini, il rilevamento di oggetti e la localizzazione di oggetti. Architetture fondamentali come AlexNet, VGG e ResNet sono state tutte sviluppate e sottoposte a benchmark su ImageNet, e i pesi pre-addestrati di ImageNet rimangono un punto di partenza comune per il transfer learning in tutte le attività di visione.

Link to this sectionUtilizzo#

Per addestrare un modello di classificazione YOLO su ImageNet per 100 epoche a una dimensione dell'immagine di 224x224, utilizza i frammenti di codice qui sotto. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Addestramento del modello.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Puoi anche gestire i dataset di classificazione ed eseguire l'addestramento nel cloud con Ultralytics Platform.

Link to this sectionEsempi di immagini e annotazioni#

Il dataset ImageNet copre le 1.000 classi ILSVRC-2012, fornendo una risorsa diversificata ed estesa per addestrare e valutare modelli di computer vision. Ecco alcune immagini di esempio dal dataset:

Immagini di esempio del dataset di classificazione ImageNet

Link to this sectionCitazioni e riconoscimenti#

Se utilizzi il dataset ImageNet nella tua attività di ricerca o sviluppo, ti preghiamo di citare il seguente documento:

Citazione

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Desideriamo ringraziare il team di ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per aver creato e mantenuto il dataset ImageNet come risorsa preziosa per la comunità di ricerca di machine learning e computer vision. Per ulteriori informazioni sul dataset ImageNet e sui suoi creatori, visita il sito web di ImageNet.

Link to this sectionFAQ#

Link to this sectionCos'è il dataset ImageNet e come viene utilizzato nella computer vision?#

Il dataset ImageNet è un database di immagini su larga scala la cui collezione più ampia contiene oltre 14 milioni di immagini ad alta risoluzione annotate con synset WordNet. In Ultralytics, data="imagenet" esegue l'addestramento sul subset standardizzato a 1.000 classi ILSVRC-2012, che è il benchmark de facto per il pre-addestramento della classificazione di immagini. Modelli fondamentali come AlexNet, VGG e ResNet sono stati addestrati e sottoposti a benchmark su ImageNet, sottolineando il suo ruolo nell'avanzamento della computer vision.

Link to this sectionQuante classi e immagini ha il dataset ImageNet?#

Il dataset Ultralytics imagenet utilizza il subset ILSVRC-2012 con 1.000 classi, 1.281.167 immagini di addestramento e 50.000 immagini di validazione a una dimensione dell'immagine di 224x224, per un download totale di circa 144 GB. Il database ImageNet completo è molto più grande (oltre 14 milioni di immagini in oltre 20.000 synset WordNet), ma il subset a 1.000 classi è quello utilizzato per l'addestramento e il benchmarking della classificazione.

Link to this sectionCome posso addestrare un modello YOLO per la classificazione di immagini sul dataset ImageNet?#

Per addestrare un modello Ultralytics YOLO su ImageNet, carica un modello di classificazione pre-addestrato e punta data su imagenet:

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Per istruzioni di addestramento più approfondite, fai riferimento alla nostra pagina di Training.

Link to this sectionPerché dovrei utilizzare i modelli preaddestrati Ultralytics YOLO26 per i miei progetti sul dataset ImageNet?#

I modelli preaddestrati Ultralytics YOLO26 offrono prestazioni all'avanguardia in termini di velocità e accuratezza per varie attività di computer vision. Ad esempio, il modello YOLO26n-cls, con un'accuratezza top-1 del 71,4% e un'accuratezza top-5 del 90,1%, è ottimizzato per applicazioni in tempo reale. I modelli preaddestrati riducono le risorse computazionali necessarie per l'addestramento da zero e accelerano i cicli di sviluppo. Scopri di più sulle metriche di prestazione dei modelli YOLO26 nella sezione Modelli preaddestrati ImageNet.

Link to this sectionChe ruolo svolge la ImageNet Large Scale Visual Recognition Challenge (ILSVRC) nella computer vision?#

L'annuale ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ha guidato i progressi nella computer vision fornendo una piattaforma competitiva per valutare gli algoritmi su un dataset standardizzato e su larga scala. Le sue metriche di valutazione coerenti hanno promosso l'innovazione nella classificazione di immagini, nel rilevamento di oggetti e nella segmentazione di immagini, spingendo continuamente i confini del deep learning e della computer vision.

Collaboratori

GLglenn-jocher¹⁶ RIRizwanMunawar² RAraimbekovm¹ AMambitious-octopus¹ MAMatthewNoyce¹ JKjk4e¹

Creato 12 nov 2023Aggiornato l’altro ieri