Salta para o conte√ļdo

Conjunto de dados ImageNet

A ImageNet √© uma base de dados em grande escala de imagens anotadas, concebida para ser utilizada na investiga√ß√£o do reconhecimento visual de objectos. Cont√©m mais de 14 milh√Ķes de imagens, com cada imagem anotada utilizando conjuntos de sin√≥nimos WordNet, o que a torna um dos recursos mais extensos dispon√≠veis para treinar modelos de aprendizagem profunda em tarefas de vis√£o computacional.

Características principais

  • O ImageNet cont√©m mais de 14 milh√Ķes de imagens de alta resolu√ß√£o que abrangem milhares de categorias de objectos.
  • O conjunto de dados est√° organizado de acordo com a hierarquia da WordNet, sendo que cada synset representa uma categoria.
  • O ImageNet √© amplamente utilizado para forma√ß√£o e avalia√ß√£o comparativa no dom√≠nio da vis√£o computacional, em especial para tarefas de classifica√ß√£o de imagens e dete√ß√£o de objectos.
  • O desafio anual ImageNet Large Scale Visual Recognition Challenge (ILSVRC) tem sido fundamental para o avan√ßo da investiga√ß√£o em vis√£o computacional.

Estrutura do conjunto de dados

O conjunto de dados ImageNet est√° organizado utilizando a hierarquia WordNet. Cada n√≥ na hierarquia representa uma categoria, e cada categoria √© descrita por um synset (uma cole√ß√£o de termos sin√≥nimos). As imagens no ImageNet s√£o anotadas com um ou mais synsets, fornecendo um recurso rico para modelos de treino para reconhecer v√°rios objectos e as suas rela√ß√Ķes.

Desafio de Reconhecimento Visual em Grande Escala ImageNet (ILSVRC)

O desafio anual ImageNet Large Scale Visual Recognition Challenge (ILSVRC) tem sido um evento importante no domínio da visão computacional. Proporciona uma plataforma para investigadores e programadores avaliarem os seus algoritmos e modelos num conjunto de dados de grande escala com métricas de avaliação normalizadas. O ILSVRC levou a avanços significativos no desenvolvimento de modelos de aprendizagem profunda para classificação de imagens, deteção de objectos e outras tarefas de visão computacional.

Aplica√ß√Ķes

O conjunto de dados ImageNet é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em várias tarefas de visão computacional, como classificação de imagens, deteção de objetos e localização de objetos. Algumas arquiteturas populares de aprendizagem profunda, como AlexNet, VGG e ResNet, foram desenvolvidas e avaliadas usando o conjunto de dados ImageNet.

Utilização

Para treinar um modelo de aprendizagem profunda no conjunto de dados ImageNet para 100 épocas com um tamanho de imagem de 224x224, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente de argumentos disponíveis, consulta a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

Exemplos de imagens e anota√ß√Ķes

O conjunto de dados ImageNet contém imagens de alta resolução que abrangem milhares de categorias de objectos, fornecendo um conjunto de dados diversificado e extenso para formação e avaliação de modelos de visão computacional. Aqui estão alguns exemplos de imagens do conjunto de dados:

Imagens de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados ImageNet, destacando a import√Ęncia de um conjunto de dados diversificado para treinar modelos robustos de vis√£o computacional.

Cita√ß√Ķes e agradecimentos

Se utilizares o conjunto de dados ImageNet no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Gostar√≠amos de agradecer √† equipa do ImageNet, liderada por Olga Russakovsky, Jia Deng e Li Fei-Fei, por criar e manter o conjunto de dados ImageNet como um recurso valioso para a comunidade de investiga√ß√£o em aprendizagem autom√°tica e vis√£o computacional. Para obter mais informa√ß√Ķes sobre o conjunto de dados ImageNet e seus criadores, visita o site do ImageNet.



Criado em 2023-11-12, Atualizado em 2024-01-12
Autores: glenn-jocher (4)

Coment√°rios