Link to this sectionDataset Caltech-256#

O conjunto de dados Caltech-256 é um benchmark clássico de classificação de imagens com 30.607 imagens distribuídas em 256 categorias de objetos mais uma classe de fundo. Cada categoria contém pelo menos 80 imagens de objetos do mundo real — animais, veículos, itens domésticos e pessoas —, tornando-o um sucessor maior e mais desafiador do Caltech-101 para modelos de reconhecimento de objetos.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

Divisão Automática de Dados

O Caltech-256 é distribuído sem uma divisão pré-definida de treino/validação. Os comandos de treinamento abaixo dividem automaticamente os dados em 80% para treino e 20% para validação, portanto não é necessária preparação manual.

Link to this sectionPrincipais recursos#

O Caltech-256 contém 30.607 imagens coloridas em 256 categorias de objetos mais uma classe de fundo 257.clutter (totalizando 257 pastas de classes).
As categorias abrangem uma grande variedade de objetos do mundo real, incluindo animais, veículos, itens domésticos e pessoas.
Cada categoria contém pelo menos 80 imagens, sendo que a maior chega a cerca de 800, portanto os tamanhos das classes são desequilibrados.
As imagens possuem tamanhos e resoluções variáveis.
O Caltech-256 é amplamente utilizado para avaliar algoritmos de classificação de imagens e reconhecimento de objetos.

Link to this sectionEstrutura do Dataset#

O Caltech-256 é distribuído em 257 pastas — uma por classe, cobrindo 256 categorias de objetos mais uma classe de fundo 257.clutter — sem uma divisão pré-definida de treino/validação. Ao iniciar o treinamento, o Ultralytics particiona automaticamente as imagens para que os modelos treinem em todas as 257 classes sem qualquer configuração manual:

Classes: 257 (256 categorias de objetos + 1 de fundo)
Total de imagens: 30.607
Divisão treino/validação: automática 80% / 20% (≈24.385 treino, ≈6.222 validação)
Imagens por classe: pelo menos 80 (desequilibrado, até cerca de 800)

Link to this sectionAplicações#

O conjunto de dados Caltech-256 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens e reconhecimento de objetos, incluindo Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs). Sua grande quantidade de categorias e imagens de alta qualidade o tornam um benchmark popular para pesquisa e prototipagem em aprendizado de máquina e visão computacional.

Link to this sectionUso#

Treine um modelo YOLO no Caltech-256 por 100 épocas com um tamanho de imagem de 416. Para a lista completa de argumentos disponíveis, consulte a página de Treinamento e o guia da tarefa de classificação de imagens.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionExemplos de Imagens e Anotações#

O conjunto de dados Caltech-256 contém imagens coloridas de alta qualidade de vários objetos, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados (crédito):

Exemplos do conjunto de dados de classificação de imagens Caltech-256

As amostras mostram a diversidade e a complexidade dos objetos no conjunto de dados Caltech-256, destacando o valor de um conjunto de dados variado para o treinamento de modelos robustos de reconhecimento de objetos.

Link to this sectionCitações e Agradecimentos#

Se você utilizar o conjunto de dados Caltech-256 em seu trabalho de pesquisa ou desenvolvimento, cite o seguinte artigo:

Citação

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Gostaríamos de agradecer a Gregory Griffin, Alex Holub e Pietro Perona por criar e manter o conjunto de dados Caltech-256 como um recurso valioso para a comunidade de pesquisa em aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados Caltech-256 e seus criadores, visite o site do conjunto de dados Caltech-256.

Link to this sectionFAQ#

Link to this sectionPara que o conjunto de dados Caltech-256 é usado no aprendizado de máquina?#

O conjunto de dados Caltech-256 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens e reconhecimento de objetos. Ele contém 30.607 imagens em 256 categorias de objetos mais uma classe de fundo, fornecendo um benchmark maior e mais desafiador do que o Caltech-101 para algoritmos como Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs).

Link to this sectionComo posso treinar um modelo Ultralytics YOLO no conjunto de dados Caltech-256?#

Para treinar um modelo Ultralytics YOLO no Caltech-256, use os snippets de código abaixo. O conjunto de dados é baixado automaticamente no primeiro uso. Para uma lista completa de argumentos, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionQuantas classes o conjunto de dados Caltech-256 possui?#

O Caltech-256 contém 256 categorias de objetos mais uma classe de fundo 257.clutter, totalizando 257 pastas de classes e 30.607 imagens no total. Ao treinar com o Ultralytics, o modelo aprende todas as 257 classes. Cada categoria contém pelo menos 80 imagens, mas os tamanhos das classes são desequilibrados, com a maior contendo até cerca de 800 imagens.

Link to this sectionComo o conjunto de dados Caltech-256 é dividido em conjuntos de treinamento e validação?#

O Caltech-256 não tem divisão pré-definida. Na primeira vez que você treina, o Ultralytics o divide automaticamente em 80% de treinamento / 20% de validação — cerca de 24.385 imagens de treinamento e 6.222 de validação — para que você não precise criar divisões manualmente. Para controlar a divisão por conta própria, organize as imagens em pastas train/ e val/ antes de treinar.

Link to this sectionPosso usar a Ultralytics Platform para treinar modelos no conjunto de dados Caltech-256?#

Sim. A Ultralytics Platform permite gerenciar conjuntos de dados, treinar modelos de classificação de imagens e implantá-los sem necessidade de muita codificação. É uma maneira conveniente de executar experimentos no Caltech-256 na nuvem, e você pode explorar mais opções em nossa visão geral de conjuntos de dados de classificação.

Contribuidores

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Criado 12 de nov. de 2023Atualizado anteontem