Salta para o conteúdo

Conjunto de dados ImageNet10

O conjunto de dados ImageNet10 é um subconjunto de pequena escala da base de dados ImageNet, desenvolvido por Ultralytics e concebido para testes de IC, verificações de sanidade e testes rápidos de pipelines de formação. Este conjunto de dados é composto pela primeira imagem do conjunto de treino e pela primeira imagem do conjunto de validação das primeiras 10 classes do ImageNet. Embora significativamente mais pequeno, mantém a estrutura e a diversidade do conjunto de dados ImageNet original.

Características principais

  • O ImageNet10 é uma versão compacta do ImageNet, com 20 imagens que representam as primeiras 10 classes do conjunto de dados original.
  • O conjunto de dados está organizado de acordo com a hierarquia do WordNet, reflectindo a estrutura do conjunto de dados completo do ImageNet.
  • É ideal para testes de IC, verificações de sanidade e testes rápidos de pipelines de formação em tarefas de visão computacional.
  • Embora não tenha sido concebido para a avaliação comparativa de modelos, pode fornecer uma indicação rápida da funcionalidade básica e da correção de um modelo.

Estrutura do conjunto de dados

O conjunto de dados ImageNet10, tal como o ImageNet original, está organizado utilizando a hierarquia WordNet. Cada uma das 10 classes no ImageNet10 é descrita por um synset (uma coleção de termos sinónimos). As imagens no ImageNet10 são anotadas com um ou mais synsets, fornecendo um recurso compacto para testar modelos para reconhecer vários objectos e as suas relações.

Aplicações

O conjunto de dados ImageNet10 é útil para testar e depurar rapidamente modelos e pipelines de visão computacional. O seu tamanho pequeno permite uma iteração rápida, tornando-o ideal para testes de integração contínua e verificações de sanidade. Também pode ser usado para testes preliminares rápidos de novos modelos ou alterações em modelos existentes antes de passar para testes em grande escala com o conjunto de dados ImageNet completo.

Utilização

Para testar um modelo de aprendizagem profunda no conjunto de dados ImageNet10 com um tamanho de imagem de 224x224, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente de argumentos disponíveis, consulta a página Treinamento do modelo.

Exemplo de teste

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Exemplos de imagens e anotações

O conjunto de dados ImageNet10 contém um subconjunto de imagens do conjunto de dados ImageNet original. Estas imagens são escolhidas para representar as primeiras 10 classes do conjunto de dados, proporcionando um conjunto de dados diversificado mas compacto para testes e avaliações rápidas.

Imagens de amostra do conjunto de dados O exemplo mostra a variedade e complexidade das imagens no conjunto de dados ImageNet10, realçando a sua utilidade para verificações de sanidade e testes rápidos de modelos de visão por computador.

Citações e agradecimentos

Se utilizares o conjunto de dados ImageNet10 no teu trabalho de investigação ou desenvolvimento, cita o artigo original do ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Gostaríamos de agradecer à equipa ImageNet, liderada por Olga Russakovsky, Jia Deng e Li Fei-Fei, pela criação e manutenção do conjunto de dados ImageNet. O conjunto de dados ImageNet10, embora seja um subconjunto compacto, é um recurso valioso para testes rápidos e depuração na comunidade de investigação de aprendizagem automática e visão computacional. Para obter mais informações sobre o conjunto de dados ImageNet e seus criadores, visita o site do ImageNet.

FAQ

O que é o conjunto de dados ImageNet10 e qual é a sua diferença em relação ao conjunto de dados ImageNet completo?

O conjunto de dados ImageNet10 é um subconjunto compacto da base de dados ImageNet original, criado por Ultralytics para testes rápidos de CI, verificações de sanidade e avaliações do pipeline de formação. O ImageNet10 inclui apenas 20 imagens, representando a primeira imagem nos conjuntos de treino e validação das primeiras 10 classes do ImageNet. Apesar da sua pequena dimensão, mantém a estrutura e a diversidade do conjunto de dados completo, tornando-o ideal para testes rápidos, mas não para modelos de aferição.

Como posso utilizar o conjunto de dados ImageNet10 para testar o meu modelo de aprendizagem profunda?

Para testar o teu modelo de aprendizagem profunda no conjunto de dados ImageNet10 com um tamanho de imagem de 224x224, utiliza os seguintes snippets de código.

Exemplo de teste

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Consulta a página Formação para obteres uma lista completa dos argumentos disponíveis.

Por que razão devo utilizar o conjunto de dados ImageNet10 para testes de IC e verificações de sanidade?

O conjunto de dados ImageNet10 foi concebido especificamente para testes de CI, verificações de sanidade e avaliações rápidas em pipelines de aprendizagem profunda. O seu tamanho reduzido permite uma iteração e testes rápidos, tornando-o perfeito para processos de integração contínua em que a velocidade é crucial. Ao manter a complexidade estrutural e a diversidade do conjunto de dados ImageNet original, o ImageNet10 fornece uma indicação confiável da funcionalidade básica e da correção de um modelo sem a sobrecarga de processar um grande conjunto de dados.

Quais são as principais características do conjunto de dados ImageNet10?

O conjunto de dados ImageNet10 tem várias características importantes:

  • Tamanho compacto: Com apenas 20 imagens, permite testes e depuração rápidos.
  • Organização estruturada: Segue a hierarquia do WordNet, semelhante ao conjunto de dados completo do ImageNet.
  • CI e verificações de sanidade: Idealmente adequado para testes de integração contínua e verificações de sanidade.
  • Não se destina a benchmarking: Embora seja útil para avaliações rápidas de modelos, não foi concebido para uma avaliação comparativa extensiva.

Onde posso descarregar o conjunto de dados ImageNet10?

Podes transferir o conjunto de dados do ImageNet10 a partir da página de lançamentos do Ultralytics GitHub. Para obteres informações mais detalhadas sobre a sua estrutura e aplicações, consulta a página do conjunto de dados ImageNet10.



Criado em 2023-11-12, Atualizado em 2024-07-10
Autores: glenn-jocher (8)

Comentários