Набор данных Caltech-256

Набор данных Caltech-256 — это обширная коллекция изображений, используемая для задач классификации объектов. Он содержит около 30 000 изображений, разделенных на 257 категорий (256 категорий объектов и 1 категория фона). Изображения тщательно отобраны и аннотированы, чтобы обеспечить сложный и разнообразный эталон для алгоритмов распознавания объектов.

Смотреть: Как обучать Классификация изображений Обучение модели с использованием набора данных Caltech-256 и алгоритма Ultralytics

Автоматическое разделение данных

Набор данных Caltech-256 в предоставленном виде не имеет предопределенных разделений на обучающую и проверочную выборки. Однако, когда вы используете команды обучения, приведенные в примерах использования ниже, фреймворк Ultralytics автоматически разделит набор данных для вас. По умолчанию используется разделение 80% для обучающего набора и 20% для проверочного набора.

Основные характеристики

Набор данных Caltech-256 содержит около 30 000 цветных изображений, разделенных на 257 категорий.
Каждая категория содержит минимум 80 изображений.
Категории охватывают широкий спектр реальных объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
Изображения имеют различные размеры и разрешения.
Caltech-256 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.

Структура набора данных

Как и Caltech-101, набор данных Caltech-256 не имеет формального разделения на обучающие и тестовые наборы. Пользователи обычно создают свои собственные разделения в соответствии со своими конкретными потребностями. Распространенной практикой является использование случайного подмножества изображений для обучения и оставшихся изображений для тестирования.

Приложения

Датасет Caltech-256 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразный набор категорий и высококачественные изображения делают его бесценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.

Пример обучения

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

Примеры изображений и аннотации

Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов, предоставляя полный набор данных для задач распознавания объектов. Вот несколько примеров изображений из набора данных (источник):

Набор данных Caltech-256 для классификации изображений: образцы

Пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.

Цитирование и благодарности

Если вы используете набор данных Caltech-256 в своей исследовательской или опытно-конструкторской работе, пожалуйста, процитируйте следующую статью:

BibTeX

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Мы хотели бы выразить признательность Грегори Гриффину, Алексу Холубу и Пьетро Перона за создание и поддержку набора данных Caltech-256 в качестве ценного ресурса для сообщества машинного обучения и исследований в области компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-256 и его создателях посетите веб-сайт набора данных Caltech-256.

Часто задаваемые вопросы

Что такое набор данных Caltech-256 и почему он важен для машинного обучения?

Набор данных Caltech-256 — это большой набор изображений, используемый в основном для задач классификации объектов в машинном обучении и компьютерном зрении. Он состоит из примерно 30 000 цветных изображений, разделенных на 257 категорий, охватывающих широкий спектр реальных объектов. Разнообразные и высококачественные изображения в наборе данных делают его отличным эталоном для оценки алгоритмов распознавания объектов, что имеет решающее значение для разработки надежных моделей машинного обучения.

Как я могу обучить модель YOLO на наборе данных Caltech-256 с использованием Python или CLI?

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, вы можете использовать следующие фрагменты кода. Обратитесь к странице Обучение модели для получения дополнительных опций.

Пример обучения

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

Каковы наиболее распространенные варианты использования набора данных Caltech-256?

Набор данных Caltech-256 широко используется для различных задач распознавания объектов, таких как:

Обучение сверточных нейронных сетей (CNN)
Оценка производительности машин опорных векторов (SVM)
Бенчмаркинг новых алгоритмов глубокого обучения
Разработка моделей обнаружения объектов с использованием таких фреймворков, как Ultralytics YOLO

Его разнообразие и всесторонние аннотации делают его идеальным для исследований и разработок в области машинного обучения и компьютерного зрения.

Как структурирован и разделен набор данных Caltech-256 для обучения и тестирования?

Набор данных Caltech-256 не поставляется с предопределенным разделением для обучения и тестирования. Пользователи обычно создают свои собственные разделения в соответствии со своими конкретными потребностями. Распространенным подходом является случайный выбор подмножества изображений для обучения и использование оставшихся изображений для тестирования. Эта гибкость позволяет пользователям адаптировать набор данных к своим конкретным требованиям проекта и экспериментальным настройкам.

Почему я должен использовать Ultralytics YOLO для обучения моделей на наборе данных Caltech-256?

Модели Ultralytics YOLO предлагают несколько преимуществ для обучения на наборе данных Caltech-256:

Высокая точность: Модели YOLO известны своей передовой производительностью в задачах обнаружения объектов.
Скорость: Они обеспечивают возможности логического вывода в реальном времени, что делает их подходящими для приложений, требующих быстрых прогнозов.
Простота использования: С платформой Ultralytics пользователи могут обучать, валидировать и развертывать модели без обширного кодирования.
Предварительно обученные модели: Начиная с предварительно обученных моделей, таких как yolo26n-cls.pt, может значительно сократить время обучения и улучшить модель точность.

Для получения более подробной информации изучите наше подробное руководство по обучению и узнайте о классификации изображений с помощью Ultralytics YOLO.

📅 Создано 2 лет назад ✏️ Обновлено 27 дней назад