Salta para o conteúdo

Conjunto de dados CIFAR-100

O conjunto de dados CIFAR-100 (Canadian Institute For Advanced Research) é uma extensão significativa do conjunto de dados CIFAR-10, composto por 60.000 imagens a cores 32x32 em 100 classes diferentes. Foi desenvolvido por investigadores do instituto CIFAR, oferecendo um conjunto de dados mais exigente para tarefas mais complexas de aprendizagem automática e visão computacional.

Características principais

  • O conjunto de dados CIFAR-100 consiste em 60.000 imagens, divididas em 100 classes.
  • Cada classe contém 600 imagens, divididas em 500 para treino e 100 para teste.
  • As imagens são coloridas e têm um tamanho de 32x32 pixéis.
  • As 100 classes diferentes são agrupadas em 20 categorias grosseiras para uma classificação de nível superior.
  • O CIFAR-100 é normalmente utilizado para formação e teste no domínio da aprendizagem automática e da visão por computador.

Estrutura do conjunto de dados

O conjunto de dados CIFAR-100 está dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto consiste em 10.000 imagens utilizadas para testar e avaliar os modelos treinados.

Aplicações

O conjunto de dados CIFAR-100 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. A diversidade do conjunto de dados em termos de classes e a presença de imagens a cores tornam-no um conjunto de dados mais desafiante e abrangente para investigação e desenvolvimento no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados CIFAR-100 para 100 épocas com um tamanho de imagem de 32x32, podes utilizar os seguintes snippets de código. Para obter uma lista completa dos argumentos disponíveis, consulta a página de treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Exemplos de imagens e anotações

O conjunto de dados CIFAR-100 contém imagens a cores de vários objectos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui tens alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados CIFAR-100, realçando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.

Citações e agradecimentos

Se utilizares o conjunto de dados CIFAR-100 no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o conjunto de dados CIFAR-100 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-100 e o seu criador, visita o sítio Web do conjunto de dados CIFAR-100.

FAQ

O que é o conjunto de dados CIFAR-100 e qual a sua importância?

O conjunto de dados CIFAR-100 é uma grande coleção de 60.000 imagens a cores 32x32 classificadas em 100 classes. Desenvolvido pelo Canadian Institute For Advanced Research (CIFAR), fornece um conjunto de dados desafiante, ideal para tarefas complexas de aprendizagem automática e visão computacional. A sua importância reside na diversidade de classes e no pequeno tamanho das imagens, tornando-o um recurso valioso para treinar e testar modelos de aprendizagem profunda, como as Redes Neuronais Convolucionais (CNN), utilizando estruturas como Ultralytics YOLO .

Como é que treino um modelo YOLO no conjunto de dados CIFAR-100?

Podes treinar um modelo YOLO no conjunto de dados CIFAR-100 utilizando os comandos Python ou CLI . Vê como:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Para obteres uma lista completa dos argumentos disponíveis, consulta a página de Formação de modelos.

Quais são as principais aplicações do conjunto de dados CIFAR-100?

O conjunto de dados CIFAR-100 é amplamente utilizado na formação e avaliação de modelos de aprendizagem profunda para classificação de imagens. O seu conjunto diversificado de 100 classes, agrupadas em 20 categorias grosseiras, proporciona um ambiente desafiante para testar algoritmos como as Redes Neuronais Convolucionais (CNN), as Máquinas de Vectores de Suporte (SVM) e várias outras abordagens de aprendizagem automática. Este conjunto de dados é um recurso fundamental na investigação e desenvolvimento nos domínios da aprendizagem automática e da visão computacional.

Como está estruturado o conjunto de dados CIFAR-100?

O conjunto de dados CIFAR-100 está dividido em dois subconjuntos principais:

  1. Conjunto de treino: Contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Consiste em 10.000 imagens utilizadas para testar e aferir os modelos treinados.

Cada uma das 100 classes contém 600 imagens, com 500 imagens para treino e 100 para teste, o que a torna ideal para uma investigação académica e industrial rigorosa.

Onde posso encontrar exemplos de imagens e anotações do conjunto de dados CIFAR-100?

O conjunto de dados CIFAR-100 inclui uma variedade de imagens a cores de vários objectos, o que o torna um conjunto de dados estruturado para tarefas de classificação de imagens. Podes consultar a página de documentação para veres exemplos de imagens e anotações. Esses exemplos destacam a diversidade e a complexidade do conjunto de dados, importantes para o treinamento de modelos robustos de classificação de imagens.



Criado em 2023-11-12, Atualizado em 2024-07-04
Autores: glenn-jocher (6)

Comentários