Dataset ImageNet10
O dataset ImageNet10 é um subconjunto de pequena escala da base de dados ImageNet, desenvolvido pela Ultralytics e concebido para testes de CI, verificações de integridade e testes rápidos de pipelines de treino. Este dataset é composto pela primeira imagem do conjunto de treino e pela primeira imagem do conjunto de validação das primeiras 10 classes do ImageNet. Embora seja significativamente mais pequeno, mantém a estrutura e a diversidade do dataset ImageNet original.
Principais recursos
- O ImageNet10 é uma versão compacta do ImageNet, com 20 imagens que representam as primeiras 10 classes do dataset original.
- O dataset está organizado de acordo com a hierarquia WordNet, espelhando a estrutura do dataset ImageNet completo.
- É ideal para testes de CI, verificações de integridade e testes rápidos de pipelines de treino em tarefas de visão computacional.
- Embora não tenha sido concebido para benchmarking de modelos, pode fornecer uma indicação rápida da funcionalidade básica e da exatidão de um modelo.
Estrutura do Dataset
O dataset ImageNet10, tal como o ImageNet original, está organizado utilizando a hierarquia WordNet. Cada uma das 10 classes no ImageNet10 é descrita por um synset (uma coleção de termos sinónimos). As imagens no ImageNet10 estão anotadas com um ou mais synsets, fornecendo um recurso compacto para testar modelos na reconhecimento de vários objetos e das suas relações.
Aplicações
O dataset ImageNet10 é útil para testar e depurar rapidamente modelos e pipelines de visão computacional. O seu tamanho reduzido permite uma iteração rápida, tornando-o ideal para testes de integração contínua e verificações de integridade. Também pode ser utilizado para testes preliminares rápidos de novos modelos ou alterações a modelos existentes antes de passar para testes em escala real com o dataset ImageNet completo.
Utilização
Para testar um modelo de deep learning no dataset ImageNet10 com um tamanho de imagem de 224x224, podes utilizar os seguintes snippets de código. Para uma lista completa de argumentos disponíveis, consulta a página de Treino do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Amostra de Imagens e Anotações
O dataset ImageNet10 contém um subconjunto de imagens do dataset ImageNet original. Estas imagens são escolhidas para representar as primeiras 10 classes no dataset, proporcionando um conjunto de dados diverso, porém compacto, para testes e avaliações rápidas.

O exemplo mostra a variedade e complexidade das imagens no dataset ImageNet10, destacando a sua utilidade para verificações de integridade e testes rápidos de modelos de visão computacional.
Citações e Agradecimentos
Se utilizares o dataset ImageNet10 no teu trabalho de investigação ou desenvolvimento, por favor cita o artigo original do ImageNet:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}Gostaríamos de agradecer à equipa do ImageNet, liderada por Olga Russakovsky, Jia Deng e Li Fei-Fei, pela criação e manutenção do dataset ImageNet. O dataset ImageNet10, embora seja um subconjunto compacto, é um recurso valioso para testes rápidos e depuração na comunidade de investigação de machine learning e visão computacional. Para mais informações sobre o dataset ImageNet e os seus criadores, visita o site do ImageNet.
FAQ
O que é o dataset ImageNet10 e como difere do dataset ImageNet completo?
O dataset ImageNet10 é um subconjunto compacto da base de dados ImageNet original, criado pela Ultralytics para testes rápidos de CI, verificações de integridade e avaliações de pipelines de treino. O ImageNet10 compreende apenas 20 imagens, representando a primeira imagem nos conjuntos de treino e validação das primeiras 10 classes no ImageNet. Apesar do seu tamanho pequeno, mantém a estrutura e a diversidade do dataset completo, tornando-o ideal para testes rápidos, mas não para benchmarking de modelos.
Como posso usar o dataset ImageNet10 para testar o meu modelo de deep learning?
Para testar o teu modelo de deep learning no dataset ImageNet10 com um tamanho de imagem de 224x224, usa os seguintes snippets de código.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Consulte a página de Treinamento para obter uma lista abrangente de argumentos disponíveis.
Por que devo usar o dataset ImageNet10 para testes de CI e verificações de integridade?
O dataset ImageNet10 foi concebido especificamente para testes de CI, verificações de integridade e avaliações rápidas em pipelines de deep learning. O seu tamanho reduzido permite uma iteração e teste rápidos, tornando-o perfeito para processos de integração contínua onde a velocidade é crucial. Ao manter a complexidade estrutural e a diversidade do dataset ImageNet original, o ImageNet10 fornece uma indicação fiável da funcionalidade básica e da exatidão de um modelo sem a sobrecarga de processar um dataset grande.
Quais são as principais características do dataset ImageNet10?
O dataset ImageNet10 tem várias características chave:
- Tamanho Compacto: Com apenas 20 imagens, permite testes e depuração rápidos.
- Organização Estruturada: Segue a hierarquia WordNet, de forma semelhante ao dataset ImageNet completo.
- CI e Verificações de Integridade: Idealmente adequado para testes de integração contínua e verificações de integridade.
- Não é para Benchmarking: Embora útil para avaliações rápidas de modelos, não foi concebido para benchmarking extensivo.
Como é que o ImageNet10 se compara a outros datasets pequenos como o ImageNette?
Embora tanto o ImageNet10 como o ImageNette sejam subconjuntos do ImageNet, servem propósitos diferentes. O ImageNet10 contém apenas 20 imagens (2 por classe) das primeiras 10 classes do ImageNet, tornando-o extremamente leve para testes de CI e verificações de integridade rápidas. Em contrapartida, o ImageNette contém milhares de imagens em 10 classes facilmente distinguíveis, tornando-o mais adequado para o treino e desenvolvimento real de modelos. O ImageNet10 é concebido para verificação da funcionalidade do pipeline, enquanto o ImageNette é melhor para experiências de treino significativas, mas mais rápidas do que com o ImageNet completo.