Link to this sectionНабор данных Caltech-256#

Набор данных Caltech-256 — это классический бенчмарк для классификации изображений, состоящий из 30 607 изображений, распределенных по 256 категориям объектов плюс один фоновый класс. Каждая категория содержит не менее 80 изображений реальных объектов — животных, транспортных средств, предметов домашнего обихода и людей, — что делает его более крупным и сложным преемником Caltech-101 для моделей распознавания объектов.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

Автоматическое разделение данных

Caltech-256 поставляется без предопределенного разделения на обучающую и валидационную выборки. Приведенные ниже команды обучения автоматически разделяют его в пропорции 80% обучения / 20% валидации, поэтому ручная подготовка не требуется.

Link to this sectionКлючевые особенности#

Caltech-256 содержит 30 607 цветных изображений в 256 категориях объектов плюс один фоновый класс 257.clutter (всего 257 папок классов).
Категории охватывают большое разнообразие реальных объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
Каждая категория содержит не менее 80 изображений, а самая большая — до 800, поэтому размеры классов несбалансированы.
Изображения имеют переменные размеры и разрешение.
Caltech-256 широко используется для оценки алгоритмов классификации изображений и распознавания объектов.

Link to this sectionСтруктура набора данных#

Caltech-256 распространяется в виде 257 папок — по одной на каждый класс, включая 256 категорий объектов и фоновый класс 257.clutter — без предопределенного разделения на обучающую и валидационную выборки. Когда ты запускаешь обучение, Ultralytics автоматически распределяет изображения, чтобы модели обучались на всех 257 классах без ручной настройки:

Классы: 257 (256 категорий объектов + 1 фоновый)
Всего изображений: 30 607
Разделение на обучение/валидацию: автоматическое 80% / 20% (≈24 385 обучение, ≈6 222 валидация)
Изображений на класс: не менее 80 (несбалансировано, до 800)

Link to this sectionПрименение#

Набор данных Caltech-256 широко используется для обучения и оценки моделей классификации изображений и распознавания объектов, включая сверточные нейронные сети (CNN) и метод опорных векторов (SVM). Большое количество категорий и высокое качество изображений делают его популярным бенчмарком для исследований и прототипирования в области машинного обучения и компьютерного зрения.

Link to this sectionИспользование#

Обучи модель YOLO на Caltech-256 в течение 100 эпох при размере изображения 416. Полный список доступных аргументов можно найти на странице Обучение и в руководстве по задаче классификации изображений.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionПримеры изображений и аннотации#

Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора (источник):

Образцы набора данных для классификации изображений Caltech-256

Примеры демонстрируют разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая ценность разнообразных данных для обучения надежных моделей распознавания объектов.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных Caltech-256 в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:

Цитата

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Мы хотели бы выразить признательность Грегори Гриффину, Алексу Холубу и Пьетро Пероне за создание и поддержку набора данных Caltech-256 как ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-256 и его создателях посети веб-сайт набора данных Caltech-256.

Link to this sectionFAQ#

Link to this sectionДля чего используется набор данных Caltech-256 в машинном обучении?#

Набор данных Caltech-256 широко используется для обучения и тестирования моделей классификации изображений и распознавания объектов. Он содержит 30 607 изображений, распределенных по 256 категориям объектов плюс фоновый класс, предоставляя более крупный и сложный бенчмарк, чем Caltech-101, для таких алгоритмов, как нейронные сети (CNN) и метод опорных векторов (SVM).

Link to this sectionКак обучить модель Ultralytics YOLO на наборе данных Caltech-256?#

Чтобы обучить модель Ultralytics YOLO на Caltech-256, используй фрагменты кода ниже. Набор данных загружается автоматически при первом использовании. Полный список аргументов можно найти на странице Обучение моделей.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionСколько классов содержит набор данных Caltech-256?#

Caltech-256 содержит 256 категорий объектов плюс один фоновый класс 257.clutter, всего 257 папок классов и 30 607 изображений. Когда ты обучаешь с помощью Ultralytics, модель изучает все 257 классов. Каждая категория содержит не менее 80 изображений, но размеры классов несбалансированы, причем в самом большом содержится около 800 изображений.

Link to this sectionКак набор данных Caltech-256 разделен на обучающую и валидационную выборки?#

В Caltech-256 нет предопределенного разделения. При первом запуске обучения Ultralytics автоматически делит данные на 80% обучающих / 20% валидационных изображений (примерно 24 385 для обучения и 6 222 для валидации), поэтому тебе не нужно создавать разделения вручную. Чтобы управлять разделением самостоятельно, разложи изображения по папкам train/ и val/ перед началом обучения.

Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-256?#

Да. Ultralytics Platform позволяет тебе управлять наборами данных, обучать модели классификации изображений и развертывать их без написания большого объема кода. Это удобный способ запуска экспериментов с Caltech-256 в облаке, и ты можешь изучить дополнительные возможности в нашем обзоре наборов данных для классификации.

Участники

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Создано 12 нояб. 2023 г.Обновлено вчера