No license

Link to this sectionConjunto de dados CIFAR-100#

O dataset CIFAR-100 (Canadian Institute For Advanced Research) é um benchmark de classificação de imagens de 60.000 imagens coloridas de 32x32 distribuídas uniformemente por 100 classes de granulação fina (600 imagens cada), que por sua vez estão agrupadas em 20 superclasses grosseiras. Criado por Alex Krizhevsky, ele vem com uma divisão predefinida de 50.000 imagens de treino e 10.000 imagens de teste, tornando-o o irmão mais difícil e de granulação mais fina do dataset CIFAR-10.

Watch: How to Train an Image Classification Model on CIFAR-100 using Ultralytics YOLO

Link to this sectionPrincipais recursos#

O CIFAR-100 contém 60.000 imagens coloridas de 32x32 pixels, divididas uniformemente em 100 classes.
Cada classe possui exatamente 600 imagens — 500 para treino e 100 para teste —, portanto o dataset é perfeitamente balanceado.
As 100 classes de granulação fina são agrupadas em 20 superclasses grosseiras para classificação de nível superior.
O conjunto de dados vem com uma divisão de treino/teste predefinida, portanto não é necessária nenhuma divisão manual ou automática.
O CIFAR-100 é um benchmark padrão para pesquisa de classificação de imagens de granulação fina e reconhecimento de objetos.

Link to this sectionEstrutura do Dataset#

O CIFAR-100 vem com uma divisão oficial e predefinida, portanto não é necessária nenhuma partição automática ou manual:

Classes: 100 classes de granulação fina, agrupadas em 20 superclasses grosseiras
Total de imagens: 60.000 (32x32 coloridas)
Conjunto de treino: 50.000 imagens (500 por classe)
Conjunto de teste: 10.000 imagens (100 por classe)

Divisão de validação

O CIFAR-100 não possui uma pasta de validação separada, portanto o Ultralytics usa o conjunto de teste de 10.000 imagens como a divisão de validação durante o treinamento por padrão. O treinamento com data="cifar100" aprende as 100 classes de granulação fina.

Link to this sectionAplicações#

O CIFAR-100 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens, desde Convolutional Neural Networks (CNNs) clássicas e Support Vector Machines (SVMs) até arquiteturas profundas modernas. Suas 100 classes de granulação fina e tamanho de imagem pequeno tornam-no um benchmark exigente para pesquisa em machine learning, comparação de algoritmos e experimentação em computer vision.

Link to this sectionUso#

Treine um modelo YOLO no CIFAR-100 por 100 epochs com um tamanho de imagem de 32. Para obter a lista completa de argumentos disponíveis, consulte a página de Treinamento e o guia da tarefa de classificação de imagens.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionExemplos de Imagens e Anotações#

Exemplos de imagens do dataset CIFAR-100:

Amostras do conjunto de dados de classificação de imagens CIFAR-100

As amostras mostram a diversidade dos objetos no dataset CIFAR-100, destacando o valor de um dataset variado para treinar modelos robustos de classificação de imagens.

Link to this sectionCitações e Agradecimentos#

Se você usar o conjunto de dados CIFAR-100 em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:

Citação

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o dataset CIFAR-100 como um recurso valioso para a comunidade de pesquisa de machine learning e computer vision. Para mais informações sobre o dataset CIFAR-100 e seu criador, visite o site do dataset CIFAR-100.

Link to this sectionFAQ#

Link to this sectionPara que serve o dataset CIFAR-100 em machine learning?#

O dataset CIFAR-100 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens de granulação fina e reconhecimento de objetos. Ele contém 60.000 imagens coloridas de 32x32 em 100 classes agrupadas em 20 superclasses, tornando-o um benchmark mais desafiador do que o CIFAR-10 para algoritmos como Convolutional Neural Networks (CNNs) e Support Vector Machines (SVMs), e para avaliar modelos de deep learning construídos com Ultralytics YOLO.

Link to this sectionComo posso treinar um modelo Ultralytics YOLO no dataset CIFAR-100?#

Para treinar um modelo Ultralytics YOLO no CIFAR-100, use os trechos de código abaixo. O dataset é baixado automaticamente no primeiro uso. Para obter uma lista completa de argumentos, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionQuantas classes o dataset CIFAR-100 possui?#

O CIFAR-100 possui 100 classes de granulação fina — como maçã, golfinho, bordo, motocicleta e foguete — com exatamente 600 imagens cada, totalizando 60.000 imagens. Essas 100 classes são adicionalmente agrupadas em 20 superclasses grosseiras (por exemplo, a superclasse árvores abrange bordo, carvalho, palmeira, pinheiro e salgueiro). O treinamento com data="cifar100" usa as 100 classes de granulação fina.

Link to this sectionComo o dataset CIFAR-100 é dividido em conjuntos de treino e teste?#

O CIFAR-100 vem com uma divisão predefinida de 50.000 imagens de treino e 10.000 imagens de teste, com exatamente 500 imagens de treino e 100 de teste por classe. Diferente dos datasets de classificação baseados em pastas que o Ultralytics divide automaticamente, a partição oficial do CIFAR-100 é usada como está, e o conjunto de teste serve como a divisão de validação durante o treinamento por padrão.

Link to this sectionPosso usar a Ultralytics Platform para treinar modelos no dataset CIFAR-100?#

Sim. A Ultralytics Platform permite gerenciar datasets, treinar modelos de classificação de imagens e implantá-los sem programação extensiva. É uma maneira conveniente de executar experimentos com o CIFAR-100 na nuvem, e você pode explorar mais opções em nossa visão geral de datasets de classificação.

Contribuidores

GLglenn-jocher¹⁵ RAraimbekovm² RIRizwanMunawar² MAMatthewNoyce¹ JKjk4e¹

Criado 12 de nov. de 2023Atualizado há 3 dias