Набор данных Caltech-101
Набор данных Caltech-101 широко используется для задач распознавания объектов и содержит около 9 000 изображений, относящихся к 101 категории объектов. Категории были выбраны таким образом, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и аннотированы, чтобы обеспечить сложную задачу для алгоритмов распознавания объектов.
Смотреть: Как обучать Классификация изображений Модель, использующая набор данных Caltech-256 с Ultralytics HUB
Автоматическое разделение данных
Набор данных Caltech-101 в предоставленном виде не имеет предопределенных разделений на обучающую и проверочную выборки. Однако, когда вы используете команды обучения, приведенные в примерах использования ниже, фреймворк Ultralytics автоматически разделит набор данных для вас. По умолчанию используется разделение 80% для обучающего набора и 20% для проверочного набора.
Основные характеристики
- Набор данных Caltech-101 содержит около 9 000 цветных изображений, разделенных на 101 категорию.
- Категории охватывают широкий спектр объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
- Количество изображений в каждой категории варьируется, составляя от 40 до 800 изображений.
- Изображения имеют разные размеры, при этом большинство изображений имеют среднее разрешение.
- Caltech-101 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.
Структура набора данных
В отличие от многих других наборов данных, набор данных Caltech-101 формально не разделен на наборы для обучения и тестирования. Пользователи обычно создают свои собственные разделения в зависимости от своих конкретных потребностей. Однако обычной практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.
Приложения
Датасет Caltech-101 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Широкое разнообразие категорий и высококачественные изображения делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Использование
Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.
Пример обучения
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416
Примеры изображений и аннотации
Датасет Caltech-101 содержит высококачественные цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:
Пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.
Цитирование и благодарности
Если вы используете набор данных Caltech-101 в своей исследовательской или опытно-конструкторской работе, пожалуйста, сошлитесь на следующую статью:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
Мы хотели бы поблагодарить Ли Фей-Фей, Роба Фергюса и Пьетро Перона за создание и поддержку набора данных Caltech-101 в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-101 и его создателях посетите веб-сайт набора данных Caltech-101.
Часто задаваемые вопросы
Для чего используется набор данных Caltech-101 в машинном обучении?
Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений в 101 категории, что обеспечивает сложный эталон для оценки алгоритмов распознавания объектов. Исследователи используют его для обучения и тестирования моделей, особенно сверточных нейронных сетей (CNN) и машин опорных векторов (SVM) в компьютерном зрении.
Как обучить модель Ultralytics YOLO на наборе данных Caltech-101?
Чтобы обучить модель Ultralytics YOLO на наборе данных Caltech-101, вы можете использовать предоставленные фрагменты кода. Например, для обучения в течение 100 эпох:
Пример обучения
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416
Для получения более подробной информации об аргументах и параметрах обратитесь к странице Обучение модели.
Каковы ключевые особенности набора данных Caltech-101?
Набор данных Caltech-101 включает в себя:
- Около 9 000 цветных изображений по 101 категории.
- Категории, охватывающие широкий спектр объектов, включая животных, транспортные средства и предметы домашнего обихода.
- Переменное количество изображений на категорию, обычно от 40 до 800.
- Различные размеры изображений, в основном среднего разрешения.
Эти функции делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.
Почему следует ссылаться на набор данных Caltech-101 в моих исследованиях?
Указание набора данных Caltech-101 в вашем исследовании подтверждает вклад создателей и предоставляет ссылку для других, кто может использовать этот набор данных. Рекомендуемая цитата:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
Цитирование помогает поддерживать целостность академической работы и помогает коллегам находить первоначальный ресурс.
Могу ли я использовать Ultralytics HUB для обучения моделей на наборе данных Caltech-101?
Да, вы можете использовать Ultralytics HUB для обучения моделей на наборе данных Caltech-101. Ultralytics HUB предоставляет интуитивно понятную платформу для управления наборами данных, обучения моделей и их развертывания без обширного кодирования. Подробное руководство см. в статье в блоге о том, как обучать свои собственные модели с помощью Ultralytics HUB.