Набор данных Caltech-256

Набор данных Caltech-256 — это обширная коллекция изображений, используемая для задач классификации объектов. Он содержит около 30 000 изображений, разделенных на 257 категорий (256 категорий объектов и 1 фоновая категория). Изображения тщательно подобраны и размечены, чтобы обеспечить сложный и разнообразный эталон для алгоритмов распознавания объектов.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
Автоматическое разделение данных

Набор данных Caltech-256 в исходном виде не содержит предопределенных разбиений на обучающую и валидационную выборки. Однако, когда ты используешь команды обучения, приведенные в примерах ниже, фреймворк Ultralytics автоматически разделит набор данных за тебя. По умолчанию используется разбиение: 80% для обучающей выборки и 20% для валидационной.

Основные характеристики

  • Набор данных Caltech-256 состоит из около 30 000 цветных изображений, разделенных на 257 категорий.
  • Каждая категория содержит не менее 80 изображений.
  • Категории охватывают широкий спектр реальных объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
  • Изображения имеют разный размер и разрешение.
  • Caltech-256 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.

Структура набора данных

Как и Caltech-101, набор данных Caltech-256 не имеет формального разделения на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разбиения в соответствии со своими конкретными потребностями. Распространенная практика — использовать случайное подмножество изображений для обучения, а остальные — для тестирования.

Приложения

Набор данных Caltech-256 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Его разнообразный набор категорий и высококачественные изображения делают его бесценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Примеры изображений и аннотаций

Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов, предоставляя всесторонний набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора (источник):

Примеры изображений из набора данных Caltech-256 для классификации

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.

Цитирование и благодарности

Если ты используешь набор данных Caltech-256 в своих исследованиях или разработках, пожалуйста, процитируй следующую статью:

Цитата
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Мы хотели бы выразить признательность Грегори Гриффину, Алексу Холубу и Пьетро Пероне за создание и поддержку набора данных Caltech-256 в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-256 и его создателях посети сайт набора данных Caltech-256.

Часто задаваемые вопросы (FAQ)

Что такое набор данных Caltech-256 и почему он важен для машинного обучения?

Набор данных Caltech-256 — это большой набор изображений, используемый преимущественно для задач классификации объектов в машинном обучении и компьютерном зрении. Он состоит из около 30 000 цветных изображений, разделенных на 257 категорий, охватывающих широкий спектр реальных объектов. Разнообразные и высококачественные изображения делают этот набор данных отличным эталоном для оценки алгоритмов распознавания объектов, что критически важно для разработки надежных моделей машинного обучения.

Как я могу обучить модель YOLO на наборе данных Caltech-256 с помощью Python или CLI?

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Дополнительные параметры ищи на странице Обучение модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Каковы наиболее распространенные варианты использования набора данных Caltech-256?

Набор данных Caltech-256 широко используется для различных задач распознавания объектов, таких как:

  • Обучение сверточных нейронных сетей (CNN)
  • Оценка производительности машин опорных векторов (SVM)
  • Бенчмаркинг новых алгоритмов глубокого обучения
  • Разработка моделей обнаружения объектов с использованием таких фреймворков, как Ultralytics YOLO

Разнообразие и исчерпывающие аннотации делают его идеальным для исследований и разработок в области машинного обучения и компьютерного зрения.

Как структурирован набор данных Caltech-256 и как он делится на обучающую и тестовую выборки?

Набор данных Caltech-256 не поставляется с предопределенным разделением на обучение и тестирование. Пользователи обычно создают свои собственные разбиения в соответствии со своими конкретными потребностями. Распространенный подход — случайный выбор подмножества изображений для обучения и использование оставшихся изображений для тестирования. Эта гибкость позволяет пользователям адаптировать набор данных к конкретным требованиям проекта и экспериментальным установкам.

Почему мне стоит использовать Ultralytics YOLO для обучения моделей на наборе данных Caltech-256?

Модели Ultralytics YOLO предлагают несколько преимуществ для обучения на наборе данных Caltech-256:

  • Высокая точность: Модели YOLO известны своей передовой производительностью в задачах обнаружения объектов.
  • Скорость: Они обеспечивают возможность вывода в режиме реального времени, что делает их подходящими для приложений, требующих быстрых предсказаний.
  • Простота использования: С Ultralytics Platform ты можешь обучать, валидировать и развертывать модели без написания большого объема кода.
  • Предобученные модели: Использование предобученных моделей, таких как yolo26n-cls.pt, может значительно сократить время обучения и повысить точность модели.

Для получения дополнительной информации изучи наше полное руководство по обучению и узнай больше о классификации изображений с Ultralytics YOLO.

Комментарии