Набор данных Caltech-101

Набор данных Caltech-101 широко используется для задач распознавания объектов и содержит около 9 000 изображений из 101 категории. Категории были выбраны так, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и размечены, чтобы обеспечить сложный эталонный тест для алгоритмов распознавания объектов.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics Platform
Автоматическое разделение данных

Набор данных Caltech-101 в исходном виде не содержит предопределенных выборок для обучения и валидации. Однако при использовании команд обучения, приведенных в примерах ниже, фреймворк Ultralytics автоматически разделит данные за тебя. По умолчанию используется 80% для обучающей выборки и 20% для валидационной.

Основные характеристики

  • Набор данных Caltech-101 состоит из около 9 000 цветных изображений, распределенных по 101 категории.
  • Категории охватывают широкий спектр объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
  • Количество изображений в каждой категории варьируется от 40 до 800.
  • Изображения имеют разный размер, большинство из них — среднего разрешения.
  • Caltech-101 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.

Структура набора данных

В отличие от многих других наборов данных, Caltech-101 официально не разделен на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разделения в соответствии со своими задачами. Однако общепринятой практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.

Приложения

Набор данных Caltech-101 активно применяется для обучения и оценки моделей глубинного обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), метод опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Его большое разнообразие категорий и качественные изображения делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов можно найти на странице Обучение.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Примеры изображений и аннотаций

Набор данных Caltech-101 содержит высококачественные цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Ниже приведены примеры изображений из этого набора:

Примеры изображений из набора данных Caltech-101

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.

Цитирование и благодарности

Если ты используешь набор данных Caltech-101 в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:

Цитата
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Мы хотели бы поблагодарить Ли Фэй-Фэй, Роба Фергуса и Пьетро Перону за создание и поддержку набора данных Caltech-101 как ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Дополнительную информацию о наборе данных Caltech-101 и его создателях можно найти на сайте набора данных Caltech-101.

Часто задаваемые вопросы (FAQ)

Для чего используется набор данных Caltech-101 в машинном обучении?

Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений из 101 категории, что является сложным тестом для оценки алгоритмов распознавания объектов. Исследователи используют его для обучения и тестирования моделей, особенно сверточных нейронных сетей (CNN) и метода опорных векторов (SVM) в компьютерном зрении.

Как обучить модель Ultralytics YOLO на наборе данных Caltech-101?

Для обучения модели Ultralytics YOLO на наборе данных Caltech-101 ты можешь воспользоваться приведенными фрагментами кода. Например, для обучения в течение 100 эпох:

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Для получения подробных аргументов и параметров обратись к странице Обучение.

Каковы ключевые особенности набора данных Caltech-101?

Набор данных Caltech-101 включает в себя:

  • Около 9 000 цветных изображений, распределенных по 101 категории.
  • Категории, охватывающие широкий спектр объектов, включая животных, транспортные средства и предметы домашнего обихода.
  • Различное количество изображений в каждой категории, обычно от 40 до 800.
  • Изображения разного размера, большинство из которых имеют среднее разрешение.

Эти особенности делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.

Почему мне следует ссылаться на набор данных Caltech-101 в моем исследовании?

Упоминание набора данных Caltech-101 в твоем исследовании подтверждает вклад авторов и предоставляет ссылку для других пользователей. Рекомендуемая цитата:

Цитата
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Цитирование помогает поддерживать целостность академической работы и помогает коллегам находить оригинальный ресурс.

Могу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101?

Да, ты можешь использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101. Платформа Ultralytics предоставляет интуитивно понятный интерфейс для управления наборами данных, обучения и развертывания моделей без написания большого объема кода. Подробное руководство можно найти в статье блога как обучить свои пользовательские модели с помощью платформы Ultralytics.

Комментарии