Saltar para o conteúdo

Conjunto de dados CIFAR-10

O conjunto de dados CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para algoritmos de aprendizagem automática e visão por computador. Foi desenvolvido por investigadores do instituto CIFAR e é composto por 60 000 imagens a cores 32x32 em 10 classes diferentes.



Ver: Como treinar um Classificação de imagens Modelo com o conjunto de dados CIFAR-10 utilizando Ultralytics YOLO11

Caraterísticas principais

  • O conjunto de dados CIFAR-10 é composto por 60 000 imagens, divididas em 10 classes.
  • Cada classe contém 6.000 imagens, divididas em 5.000 para treino e 1.000 para teste.
  • As imagens são coloridas e têm um tamanho de 32x32 pixéis.
  • As 10 classes diferentes representam aviões, carros, pássaros, gatos, veados, cães, rãs, cavalos, navios e camiões.
  • O CIFAR-10 é normalmente utilizado para formação e teste no domínio da aprendizagem automática e da visão computacional.

Estrutura do conjunto de dados

O conjunto de dados CIFAR-10 está dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto é constituído por 10 000 imagens utilizadas para testar e aferir os modelos treinados.

Aplicações

O conjunto de dados CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, tais como Redes Neuronais Convolucionais (CNN), Máquinas de Vectores de Suporte (SVM) e vários outros algoritmos de aprendizagem automática. A diversidade do conjunto de dados em termos de classes e a presença de imagens a cores fazem dele um conjunto de dados completo para investigação e desenvolvimento no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados CIFAR-10 para 100 épocas com um tamanho de imagem de 32x32, pode utilizar os seguintes fragmentos de código. Para obter uma lista completa dos argumentos disponíveis, consulte a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Exemplos de imagens e anotações

O conjunto de dados CIFAR-10 contém imagens a cores de vários objectos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados CIFAR-10, realçando a importância de um conjunto de dados diversificado para treinar modelos de classificação de imagens robustos.

Citações e agradecimentos

Se utilizar o conjunto de dados CIFAR-10 no seu trabalho de investigação ou desenvolvimento, cite o seguinte documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por ter criado e mantido o conjunto de dados CIFAR-10 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-10 e o seu criador, visite o sítio Web do conjunto de dados CIFAR-10.

FAQ

Como é que posso treinar um modelo YOLO no conjunto de dados CIFAR-10?

Para treinar um modelo YOLO no conjunto de dados CIFAR-10 utilizando Ultralytics, pode seguir os exemplos fornecidos para Python e CLI. Eis um exemplo básico para treinar o seu modelo para 100 épocas com um tamanho de imagem de 32x32 pixels:

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Para mais pormenores, consulte a página de formação do modelo.

Quais são as principais caraterísticas do conjunto de dados CIFAR-10?

O conjunto de dados CIFAR-10 consiste em 60.000 imagens a cores divididas em 10 classes. Cada classe contém 6.000 imagens, com 5.000 para treino e 1.000 para teste. As imagens têm um tamanho de 32x32 píxeis e variam entre as seguintes categorias:

  • Aviões
  • Automóveis
  • Aves
  • Gatos
  • Cervo
  • Cães
  • Rãs
  • Cavalos
  • Navios
  • Camiões

Este conjunto de dados diversificado é essencial para treinar modelos de classificação de imagens em domínios como a aprendizagem automática e a visão por computador. Para mais informações, visite as secções do CIFAR-10 sobre a estrutura do conjunto de dados e as aplicações.

Porquê utilizar o conjunto de dados CIFAR-10 para tarefas de classificação de imagens?

O conjunto de dados CIFAR-10 é uma excelente referência para a classificação de imagens devido à sua diversidade e estrutura. Ele contém uma mistura equilibrada de 60.000 imagens rotuladas em 10 categorias diferentes, o que ajuda no treinamento de modelos robustos e generalizados. É amplamente utilizado para avaliar modelos de aprendizagem profunda, incluindo Redes Neuronais Convolucionais (CNNs) e outros algoritmos de aprendizagem automática. O conjunto de dados é relativamente pequeno, o que o torna adequado para uma rápida experimentação e desenvolvimento de algoritmos. Explore as suas inúmeras aplicações na secção de aplicações.

Como é que o conjunto de dados CIFAR-10 está estruturado?

O conjunto de dados CIFAR-10 está estruturado em dois subconjuntos principais:

  1. Conjunto de treino: Contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Consiste em 10.000 imagens para testar e aferir os modelos treinados.

Cada subconjunto inclui imagens categorizadas em 10 classes, com as suas anotações prontamente disponíveis para a formação e avaliação do modelo. Para obter informações mais detalhadas, consulte a secção sobre a estrutura do conjunto de dados.

Como posso citar o conjunto de dados CIFAR-10 na minha investigação?

Se utilizar o conjunto de dados CIFAR-10 nos seus projectos de investigação ou desenvolvimento, certifique-se de que cita o seguinte documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

O reconhecimento dos criadores do conjunto de dados ajuda a apoiar a investigação e o desenvolvimento contínuos neste domínio. Para mais informações, consulte a secção de citações e agradecimentos.

Quais são alguns exemplos práticos de utilização do conjunto de dados CIFAR-10?

O conjunto de dados CIFAR-10 é frequentemente utilizado para treinar modelos de classificação de imagens, como as Redes Neuronais Convolucionais (CNN) e as Máquinas de Vectores de Suporte (SVM). Estes modelos podem ser utilizados em várias tarefas de visão computacional, incluindo deteção de objectos, reconhecimento de imagens e etiquetagem automática. Para ver alguns exemplos práticos, consulte os trechos de código na secção de utilização.

📅C riado há 1 ano ✏️ Atualizado há 2 meses

Comentários