Conjunto de dados CIFAR-10
O conjunto de dados CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para algoritmos de aprendizagem automática e visão por computador. Foi desenvolvido por investigadores do instituto CIFAR e é composto por 60 000 imagens a cores 32x32 em 10 classes diferentes.
Ver: Como treinar um Classificação de imagens Modelo com o conjunto de dados CIFAR-10 utilizando Ultralytics YOLO11
Caraterísticas principais
- O conjunto de dados CIFAR-10 é composto por 60 000 imagens, divididas em 10 classes.
- Cada classe contém 6.000 imagens, divididas em 5.000 para treino e 1.000 para teste.
- As imagens são coloridas e têm um tamanho de 32x32 pixéis.
- As 10 classes diferentes representam aviões, carros, pássaros, gatos, veados, cães, rãs, cavalos, navios e camiões.
- O CIFAR-10 é normalmente utilizado para formação e teste no domínio da aprendizagem automática e da visão computacional.
Estrutura do conjunto de dados
O conjunto de dados CIFAR-10 está dividido em dois subconjuntos:
- Conjunto de treino: Este subconjunto contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
- Conjunto de teste: Este subconjunto é constituído por 10 000 imagens utilizadas para testar e aferir os modelos treinados.
Aplicações
O conjunto de dados CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, tais como Redes Neuronais Convolucionais (CNN), Máquinas de Vectores de Suporte (SVM) e vários outros algoritmos de aprendizagem automática. A diversidade do conjunto de dados em termos de classes e a presença de imagens a cores fazem dele um conjunto de dados completo para investigação e desenvolvimento no domínio da aprendizagem automática e da visão computacional.
Utilização
Para treinar um modelo YOLO no conjunto de dados CIFAR-10 para 100 épocas com um tamanho de imagem de 32x32, pode utilizar os seguintes fragmentos de código. Para obter uma lista completa dos argumentos disponíveis, consulte a página Treinamento do modelo.
Exemplo de comboio
Exemplos de imagens e anotações
O conjunto de dados CIFAR-10 contém imagens a cores de vários objectos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:
O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados CIFAR-10, realçando a importância de um conjunto de dados diversificado para treinar modelos de classificação de imagens robustos.
Citações e agradecimentos
Se utilizar o conjunto de dados CIFAR-10 no seu trabalho de investigação ou desenvolvimento, cite o seguinte documento:
Gostaríamos de agradecer a Alex Krizhevsky por ter criado e mantido o conjunto de dados CIFAR-10 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-10 e o seu criador, visite o sítio Web do conjunto de dados CIFAR-10.
FAQ
Como é que posso treinar um modelo YOLO no conjunto de dados CIFAR-10?
Para treinar um modelo YOLO no conjunto de dados CIFAR-10 utilizando Ultralytics, pode seguir os exemplos fornecidos para Python e CLI. Eis um exemplo básico para treinar o seu modelo para 100 épocas com um tamanho de imagem de 32x32 pixels:
Exemplo
Para mais pormenores, consulte a página de formação do modelo.
Quais são as principais caraterísticas do conjunto de dados CIFAR-10?
O conjunto de dados CIFAR-10 consiste em 60.000 imagens a cores divididas em 10 classes. Cada classe contém 6.000 imagens, com 5.000 para treino e 1.000 para teste. As imagens têm um tamanho de 32x32 píxeis e variam entre as seguintes categorias:
- Aviões
- Automóveis
- Aves
- Gatos
- Cervo
- Cães
- Rãs
- Cavalos
- Navios
- Camiões
Este conjunto de dados diversificado é essencial para treinar modelos de classificação de imagens em domínios como a aprendizagem automática e a visão por computador. Para mais informações, visite as secções do CIFAR-10 sobre a estrutura do conjunto de dados e as aplicações.
Porquê utilizar o conjunto de dados CIFAR-10 para tarefas de classificação de imagens?
O conjunto de dados CIFAR-10 é uma excelente referência para a classificação de imagens devido à sua diversidade e estrutura. Ele contém uma mistura equilibrada de 60.000 imagens rotuladas em 10 categorias diferentes, o que ajuda no treinamento de modelos robustos e generalizados. É amplamente utilizado para avaliar modelos de aprendizagem profunda, incluindo Redes Neuronais Convolucionais (CNNs) e outros algoritmos de aprendizagem automática. O conjunto de dados é relativamente pequeno, o que o torna adequado para uma rápida experimentação e desenvolvimento de algoritmos. Explore as suas inúmeras aplicações na secção de aplicações.
Como é que o conjunto de dados CIFAR-10 está estruturado?
O conjunto de dados CIFAR-10 está estruturado em dois subconjuntos principais:
- Conjunto de treino: Contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
- Conjunto de teste: Consiste em 10.000 imagens para testar e aferir os modelos treinados.
Cada subconjunto inclui imagens categorizadas em 10 classes, com as suas anotações prontamente disponíveis para a formação e avaliação do modelo. Para obter informações mais detalhadas, consulte a secção sobre a estrutura do conjunto de dados.
Como posso citar o conjunto de dados CIFAR-10 na minha investigação?
Se utilizar o conjunto de dados CIFAR-10 nos seus projectos de investigação ou desenvolvimento, certifique-se de que cita o seguinte documento:
O reconhecimento dos criadores do conjunto de dados ajuda a apoiar a investigação e o desenvolvimento contínuos neste domínio. Para mais informações, consulte a secção de citações e agradecimentos.
Quais são alguns exemplos práticos de utilização do conjunto de dados CIFAR-10?
O conjunto de dados CIFAR-10 é frequentemente utilizado para treinar modelos de classificação de imagens, como as Redes Neuronais Convolucionais (CNN) e as Máquinas de Vectores de Suporte (SVM). Estes modelos podem ser utilizados em várias tarefas de visão computacional, incluindo deteção de objectos, reconhecimento de imagens e etiquetagem automática. Para ver alguns exemplos práticos, consulte os trechos de código na secção de utilização.