Salta para o conteúdo

Conjunto de dados ImageNet10

O conjunto de dados ImageNet10 é um subconjunto de pequena escala da base de dados ImageNet, desenvolvido por Ultralytics e concebido para testes de IC, verificações de sanidade e testes rápidos de pipelines de formação. Este conjunto de dados é composto pela primeira imagem do conjunto de treino e pela primeira imagem do conjunto de validação das primeiras 10 classes do ImageNet. Embora significativamente mais pequeno, mantém a estrutura e a diversidade do conjunto de dados ImageNet original.

Características principais

  • O ImageNet10 é uma versão compacta do ImageNet, com 20 imagens que representam as primeiras 10 classes do conjunto de dados original.
  • O conjunto de dados está organizado de acordo com a hierarquia do WordNet, reflectindo a estrutura do conjunto de dados completo do ImageNet.
  • É ideal para testes de IC, verificações de sanidade e testes rápidos de pipelines de formação em tarefas de visão computacional.
  • Embora não tenha sido concebido para a avaliação comparativa de modelos, pode fornecer uma indicação rápida da funcionalidade básica e da correção de um modelo.

Estrutura do conjunto de dados

O conjunto de dados ImageNet10, tal como o ImageNet original, está organizado utilizando a hierarquia WordNet. Cada uma das 10 classes no ImageNet10 é descrita por um synset (uma coleção de termos sinónimos). As imagens no ImageNet10 são anotadas com um ou mais synsets, fornecendo um recurso compacto para testar modelos para reconhecer vários objectos e as suas relações.

Aplicações

O conjunto de dados ImageNet10 é útil para testar e depurar rapidamente modelos e pipelines de visão computacional. O seu tamanho pequeno permite uma iteração rápida, tornando-o ideal para testes de integração contínua e verificações de sanidade. Também pode ser usado para testes preliminares rápidos de novos modelos ou alterações em modelos existentes antes de passar para testes em grande escala com o conjunto de dados ImageNet completo.

Utilização

Para testar um modelo de aprendizagem profunda no conjunto de dados ImageNet10 com um tamanho de imagem de 224x224, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente de argumentos disponíveis, consulta a página Treinamento do modelo.

Exemplo de teste

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet10', epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Exemplos de imagens e anotações

O conjunto de dados ImageNet10 contém um subconjunto de imagens do conjunto de dados ImageNet original. Estas imagens são escolhidas para representar as primeiras 10 classes do conjunto de dados, proporcionando um conjunto de dados diversificado mas compacto para testes e avaliações rápidas.

Imagens de amostra do conjunto de dados O exemplo mostra a variedade e complexidade das imagens no conjunto de dados ImageNet10, realçando a sua utilidade para verificações de sanidade e testes rápidos de modelos de visão por computador.

Citações e agradecimentos

Se utilizares o conjunto de dados ImageNet10 no teu trabalho de investigação ou desenvolvimento, cita o artigo original do ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Gostaríamos de agradecer à equipa ImageNet, liderada por Olga Russakovsky, Jia Deng e Li Fei-Fei, pela criação e manutenção do conjunto de dados ImageNet. O conjunto de dados ImageNet10, embora seja um subconjunto compacto, é um recurso valioso para testes rápidos e depuração na comunidade de investigação de aprendizagem automática e visão computacional. Para obter mais informações sobre o conjunto de dados ImageNet e seus criadores, visita o site do ImageNet.



Criado em 2023-11-12, Atualizado em 2024-01-07
Autores: glenn-jocher (4)

Comentários