Meet YOLO26: next-gen vision AI.

Link to this sectionJeu de données ImageNet#

ImageNet est une base de données à grande échelle d'images annotées, conçue pour la recherche en reconnaissance visuelle d'objets. Elle contient plus de 14 millions d'images, chacune annotée à l'aide de synsets WordNet, ce qui en fait l'une des ressources les plus complètes disponibles pour entraîner des modèles de deep learning dans des tâches de computer vision.

Link to this sectionModèles pré-entraînés ImageNet#

Modèletaille
(pixels)
acc
top1
acc
top5
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B) à 224
YOLO26n-cls22471.490.15.0 ± 0.31.1 ± 0.02.80.5
YOLO26s-cls22476.092.97.9 ± 0.21.3 ± 0.06.71.6
YOLO26m-cls22478.194.217.2 ± 0.42.0 ± 0.011.64.9
YOLO26l-cls22479.094.623.2 ± 0.32.8 ± 0.014.16.2
YOLO26x-cls22479.995.041.4 ± 0.93.8 ± 0.029.613.6

Link to this sectionFonctionnalités clés#

  • ImageNet contient plus de 14 millions d'images haute résolution couvrant des milliers de catégories d'objets.
  • Le jeu de données est organisé selon la hiérarchie WordNet, chaque synset représentant une catégorie.
  • ImageNet est largement utilisé pour l'entraînement et l'évaluation comparative dans le domaine de la computer vision, particulièrement pour les tâches d' image classification et d' object detection.
  • Le défi annuel ImageNet Large Scale Visual Recognition Challenge (ILSVRC) a joué un rôle déterminant dans l'avancement de la recherche en computer vision.

Link to this sectionStructure du jeu de données#

Le jeu de données ImageNet est organisé en utilisant la hiérarchie WordNet. Chaque nœud de la hiérarchie représente une catégorie, et chaque catégorie est décrite par un synset (une collection de termes synonymes). Les images dans ImageNet sont annotées avec un ou plusieurs synsets, offrant une ressource riche pour entraîner des modèles à reconnaître divers objets et leurs relations.

Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)#

Le défi annuel ImageNet Large Scale Visual Recognition Challenge (ILSVRC) a été un événement important dans le domaine de la computer vision. Il a fourni une plateforme permettant aux chercheurs et développeurs d'évaluer leurs algorithmes et modèles sur un jeu de données à grande échelle avec des métriques d'évaluation standardisées. L'ILSVRC a conduit à des avancées significatives dans le développement de modèles de deep learning pour l'image classification, l'object detection et d'autres tâches de computer vision.

Link to this sectionApplications#

Le jeu de données ImageNet est largement utilisé pour entraîner et évaluer des modèles de deep learning dans diverses tâches de computer vision, telles que l'image classification, l'object detection et l'object localization. Certaines architectures populaires de deep learning, telles que AlexNet, VGG et ResNet, ont été développées et évaluées en utilisant le jeu de données ImageNet.

Link to this sectionUtilisation#

Pour entraîner un modèle de deep learning sur le jeu de données ImageNet pendant 100 epochs avec une taille d'image de 224x224, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Training du modèle.

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Link to this sectionExemples d'images et annotations#

Le jeu de données ImageNet contient des images haute résolution couvrant des milliers de catégories d'objets, offrant un jeu de données diversifié et étendu pour entraîner et évaluer des modèles de computer vision. Voici quelques exemples d'images issues du jeu de données :

Exemples d'images du jeu de données de classification ImageNet

Cet exemple met en évidence la variété et la complexité des images dans le jeu de données ImageNet, soulignant l'importance d'un jeu de données diversifié pour entraîner des modèles de computer vision robustes.

Link to this sectionCitations et remerciements#

Si tu utilises le jeu de données ImageNet dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation
@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Nous tenons à remercier l'équipe ImageNet, dirigée par Olga Russakovsky, Jia Deng et Li Fei-Fei, pour avoir créé et maintenu le jeu de données ImageNet en tant que ressource précieuse pour la communauté de recherche en machine learning et en computer vision. Pour plus d'informations sur le jeu de données ImageNet et ses créateurs, visite le site web d'ImageNet.

Link to this sectionFAQ#

Link to this sectionQu'est-ce que le jeu de données ImageNet et comment est-il utilisé en computer vision ?#

Le jeu de données ImageNet est une base de données à grande échelle composée de plus de 14 millions d'images haute résolution classées à l'aide de synsets WordNet. Il est largement utilisé dans la recherche en reconnaissance visuelle d'objets, incluant l'image classification et l'object detection. Les annotations et le volume important du jeu de données offrent une ressource riche pour entraîner des modèles de deep learning. Notamment, des modèles comme AlexNet, VGG et ResNet ont été entraînés et évalués en utilisant ImageNet, démontrant son rôle dans l'avancement de la computer vision.

Link to this sectionComment puis-je utiliser un modèle YOLO pré-entraîné pour l'image classification sur le jeu de données ImageNet ?#

Pour utiliser un modèle Ultralytics YOLO pré-entraîné pour l'image classification sur le jeu de données ImageNet, suis ces étapes :

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Pour des instructions d'entraînement plus approfondies, consulte notre page Training.

Link to this sectionPourquoi devrais-je utiliser les modèles pré-entraînés Ultralytics YOLO26 pour mes projets sur le jeu de données ImageNet ?#

Les modèles pré-entraînés Ultralytics YOLO26 offrent des performances de pointe en termes de vitesse et d'accuracy pour diverses tâches de computer vision. Par exemple, le modèle YOLO26n-cls, avec une top-1 accuracy de 71,4% et une top-5 accuracy de 90,1%, est optimisé pour les applications en temps réel. Les modèles pré-entraînés réduisent les ressources informatiques nécessaires pour un entraînement complet et accélèrent les cycles de développement. Apprends-en plus sur les métriques de performance des modèles YOLO26 dans la section ImageNet Pretrained Models.

Link to this sectionComment le jeu de données ImageNet est-il structuré et pourquoi est-ce important ?#

Le jeu de données ImageNet est organisé en utilisant la hiérarchie WordNet, où chaque nœud de la hiérarchie représente une catégorie décrite par un synset (une collection de termes synonymes). Cette structure permet des annotations détaillées, ce qui le rend idéal pour entraîner des modèles à reconnaître une grande variété d'objets. La diversité et la richesse des annotations d'ImageNet en font un jeu de données précieux pour développer des modèles de deep learning robustes et généralisables. Tu trouveras plus d'informations sur cette organisation dans la section Dataset Structure.

Link to this sectionQuel rôle joue le ImageNet Large Scale Visual Recognition Challenge (ILSVRC) en computer vision ?#

Le ImageNet Large Scale Visual Recognition Challenge (ILSVRC) annuel a été essentiel pour stimuler les avancées en computer vision en fournissant une plateforme compétitive pour évaluer les algorithmes sur un jeu de données standardisé à grande échelle. Il propose des métriques d'évaluation standardisées, favorisant l'innovation et le développement dans des domaines tels que l'image classification, l'object detection et l' image segmentation. Le défi a continuellement repoussé les limites de ce qui est possible avec les technologies de deep learning et de computer vision.

Commentaires