Набор данных Caltech-101
Набор данных Caltech-101 широко используется для задач распознавания объектов и содержит около 9 000 изображений из 101 категории. Категории были выбраны так, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и размечены, чтобы обеспечить сложный эталонный тест для алгоритмов распознавания объектов.
Набор данных Caltech-101 в исходном виде не содержит предопределенных выборок для обучения и валидации. Однако при использовании команд обучения, приведенных в примерах ниже, фреймворк Ultralytics автоматически разделит данные за тебя. По умолчанию используется 80% для обучающей выборки и 20% для валидационной.
Основные характеристики
- Набор данных Caltech-101 состоит из около 9 000 цветных изображений, распределенных по 101 категории.
- Категории охватывают широкий спектр объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
- Количество изображений в каждой категории варьируется от 40 до 800.
- Изображения имеют разный размер, большинство из них — среднего разрешения.
- Caltech-101 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.
Структура набора данных
В отличие от многих других наборов данных, Caltech-101 официально не разделен на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разделения в соответствии со своими задачами. Однако общепринятой практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.
Приложения
Набор данных Caltech-101 активно применяется для обучения и оценки моделей глубинного обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), метод опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Его большое разнообразие категорий и качественные изображения делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Использование
Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов можно найти на странице Обучение.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Примеры изображений и аннотаций
Набор данных Caltech-101 содержит высококачественные цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Ниже приведены примеры изображений из этого набора:

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.
Цитирование и благодарности
Если ты используешь набор данных Caltech-101 в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Мы хотели бы поблагодарить Ли Фэй-Фэй, Роба Фергуса и Пьетро Перону за создание и поддержку набора данных Caltech-101 как ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Дополнительную информацию о наборе данных Caltech-101 и его создателях можно найти на сайте набора данных Caltech-101.
Часто задаваемые вопросы (FAQ)
Для чего используется набор данных Caltech-101 в машинном обучении?
Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений из 101 категории, что является сложным тестом для оценки алгоритмов распознавания объектов. Исследователи используют его для обучения и тестирования моделей, особенно сверточных нейронных сетей (CNN) и метода опорных векторов (SVM) в компьютерном зрении.
Как обучить модель Ultralytics YOLO на наборе данных Caltech-101?
Для обучения модели Ultralytics YOLO на наборе данных Caltech-101 ты можешь воспользоваться приведенными фрагментами кода. Например, для обучения в течение 100 эпох:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Для получения подробных аргументов и параметров обратись к странице Обучение.
Каковы ключевые особенности набора данных Caltech-101?
Набор данных Caltech-101 включает в себя:
- Около 9 000 цветных изображений, распределенных по 101 категории.
- Категории, охватывающие широкий спектр объектов, включая животных, транспортные средства и предметы домашнего обихода.
- Различное количество изображений в каждой категории, обычно от 40 до 800.
- Изображения разного размера, большинство из которых имеют среднее разрешение.
Эти особенности делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.
Почему мне следует ссылаться на набор данных Caltech-101 в моем исследовании?
Упоминание набора данных Caltech-101 в твоем исследовании подтверждает вклад авторов и предоставляет ссылку для других пользователей. Рекомендуемая цитата:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Цитирование помогает поддерживать целостность академической работы и помогает коллегам находить оригинальный ресурс.
Могу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101?
Да, ты можешь использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101. Платформа Ultralytics предоставляет интуитивно понятный интерфейс для управления наборами данных, обучения и развертывания моделей без написания большого объема кода. Подробное руководство можно найти в статье блога как обучить свои пользовательские модели с помощью платформы Ultralytics.