Dataset CIFAR-100

O dataset CIFAR-100 (Canadian Institute For Advanced Research) é uma extensão significativa do dataset CIFAR-10, composto por 60.000 imagens coloridas de 32x32 em 100 classes diferentes. Foi desenvolvido por pesquisadores no instituto CIFAR, oferecendo um dataset mais desafiador para tarefas mais complexas de aprendizado de máquina e visão computacional.



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Principais recursos

  • O dataset CIFAR-100 consiste em 60.000 imagens, divididas em 100 classes.
  • Cada classe contém 600 imagens, divididas em 500 para treinamento e 100 para teste.
  • As imagens são coloridas e têm um tamanho de 32x32 pixels.
  • As 100 classes diferentes são agrupadas em 20 categorias grosseiras para classificação de nível superior.
  • O CIFAR-100 é comumente usado para treinamento e teste no campo do aprendizado de máquina e visão computacional.

Estrutura do Dataset

O dataset CIFAR-100 é dividido em dois subconjuntos:

  1. Conjunto de Treinamento: Este subconjunto contém 50.000 imagens usadas para treinar modelos de machine learning.
  2. Conjunto de Testes: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.

Aplicações

O dataset CIFAR-100 é extensivamente usado para treinar e avaliar modelos de aprendizado profundo em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizado de máquina. A diversidade do dataset em termos de classes e a presença de imagens coloridas tornam-no um dataset mais desafiador e abrangente para pesquisa e desenvolvimento no campo de aprendizado de máquina e visão computacional.

Utilização

Para treinar um modelo YOLO no dataset CIFAR-100 por 100 épocas com um tamanho de imagem de 32x32, podes usar os seguintes trechos de código. Para uma lista completa de argumentos disponíveis, consulta a página de Treinamento do modelo.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Amostra de Imagens e Anotações

O dataset CIFAR-100 contém imagens coloridas de vários objetos, fornecendo um dataset bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do dataset:

Amostras do dataset de classificação de imagens CIFAR-100

O exemplo mostra a variedade e a complexidade dos objetos no dataset CIFAR-100, destacando a importância de um dataset diversificado para treinar modelos robustos de classificação de imagens.

Citações e Agradecimentos

Se usares o dataset CIFAR-100 no teu trabalho de pesquisa ou desenvolvimento, por favor cita o seguinte artigo:

Citação
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o dataset CIFAR-100 como um recurso valioso para a comunidade de pesquisa em aprendizado de máquina e visão computacional. Para mais informações sobre o dataset CIFAR-100 e seu criador, visita o site do dataset CIFAR-100.

FAQ

O que é o dataset CIFAR-100 e por que ele é significativo?

O dataset CIFAR-100 é uma grande coleção de 60.000 imagens coloridas de 32x32 classificadas em 100 classes. Desenvolvido pelo Canadian Institute For Advanced Research (CIFAR), ele fornece um dataset desafiador, ideal para tarefas complexas de aprendizado de máquina e visão computacional. Sua importância reside na diversidade das classes e no tamanho reduzido das imagens, tornando-o um recurso valioso para treinar e testar modelos de aprendizado profundo, como Redes Neurais Convolucionais (CNNs), usando frameworks como Ultralytics YOLO.

Como posso treinar um modelo YOLO no dataset CIFAR-100?

Podes treinar um modelo YOLO no dataset CIFAR-100 usando Python ou comandos CLI. Eis como:

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Para uma lista completa de argumentos disponíveis, por favor consulta a página de Treinamento do modelo.

Quais são as principais aplicações do dataset CIFAR-100?

O dataset CIFAR-100 é extensivamente usado no treinamento e avaliação de modelos de aprendizado profundo para classificação de imagens. Seu conjunto diversificado de 100 classes, agrupadas em 20 categorias grosseiras, fornece um ambiente desafiador para testar algoritmos como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e várias outras abordagens de aprendizado de máquina. Este dataset é um recurso fundamental em pesquisa e desenvolvimento nos campos de aprendizado de máquina e visão computacional, particularmente para tarefas de reconhecimento de objetos e classificação.

Como o dataset CIFAR-100 é estruturado?

O dataset CIFAR-100 é dividido em dois subconjuntos principais:

  1. Conjunto de Treinamento: Contém 50.000 imagens usadas para treinar modelos de machine learning.
  2. Conjunto de Teste: Consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.

Cada uma das 100 classes contém 600 imagens, com 500 imagens para treinamento e 100 para teste, tornando-o adequadamente único para pesquisas acadêmicas e industriais rigorosas.

Onde posso encontrar amostras de imagens e anotações do dataset CIFAR-100?

O dataset CIFAR-100 inclui uma variedade de imagens coloridas de vários objetos, tornando-o um dataset estruturado para tarefas de classificação de imagens. Podes consultar a página de documentação para ver amostras de imagens e anotações. Estes exemplos destacam a diversidade e complexidade do dataset, importantes para treinar modelos robustos de classificação de imagens. Para mais datasets adequados para tarefas de classificação, confere a visão geral dos datasets de classificação da Ultralytics.

Comentários