Link to this sectionНабор данных Caltech-101#
Набор данных Caltech-101 широко используется для задач распознавания объектов и содержит около 9 000 изображений, распределенных по 101 категории. Категории были выбраны таким образом, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и размечены, чтобы служить сложным эталоном для алгоритмов распознавания объектов.
Набор данных Caltech-101 в исходном виде не имеет предопределенного разделения на обучающую и валидационную выборки. Однако при использовании команд обучения, приведенных в примерах ниже, фреймворк Ultralytics автоматически разделит набор данных для тебя. По умолчанию используется соотношение 80% для обучающей выборки и 20% для валидационной.
Link to this sectionКлючевые особенности#
- Набор данных Caltech-101 состоит из около 9 000 цветных изображений, распределенных по 101 категории.
- Категории включают в себя широкий спектр объектов, в том числе животных, транспортные средства, предметы домашнего обихода и людей.
- Количество изображений в каждой категории варьируется: от 40 до 800 штук.
- Изображения имеют разный размер, большинство из них представлены в среднем разрешении.
- Caltech-101 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.
Link to this sectionСтруктура набора данных#
В отличие от многих других наборов данных, Caltech-101 официально не разделен на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разделения в зависимости от конкретных нужд. Однако общепринятой практикой является использование случайного подмножества изображений для обучения (например, по 30 изображений на категорию) и оставшихся изображений для тестирования.
Link to this sectionПрименение#
Набор данных Caltech-101 активно используется для обучения и оценки моделей глубинного обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNNs), метод опорных векторов (SVMs) и другие алгоритмы машинного обучения. Большое разнообразие категорий и высокое качество изображений делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Link to this sectionИспользование#
Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов можно найти на странице обучения модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this sectionПримеры изображений и аннотации#
Набор данных Caltech-101 содержит качественные цветные изображения различных объектов, предоставляя хорошо структурированные данные для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразных данных для обучения надежных моделей распознавания объектов.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных Caltech-101 в своей исследовательской или проектной работе, пожалуйста, сошлися на следующую публикацию:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Мы хотим выразить признательность Ли Фэй-Фэй, Робу Фергюсу и Пьетро Пероне за создание и поддержку набора данных Caltech-101 в качестве ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-101 и его создателях посети веб-сайт набора данных Caltech-101.
Link to this sectionFAQ#
Link to this sectionДля чего используется набор данных Caltech-101 в машинном обучении?#
Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений, распределенных по 101 категории, и является сложным эталоном для оценки алгоритмов распознавания. Исследователи используют его для обучения и тестирования моделей, особенно сверточных нейронных сетей (CNNs) и метода опорных векторов (SVMs) в компьютерном зрении.
Link to this sectionКак обучить модель Ultralytics YOLO на наборе данных Caltech-101?#
Чтобы обучить модель Ultralytics YOLO на наборе данных Caltech-101, ты можешь воспользоваться приведенными фрагментами кода. Например, для обучения в течение 100 эпох:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Более подробную информацию об аргументах и настройках ты найдешь на странице обучения модели.
Link to this sectionКаковы ключевые особенности набора данных Caltech-101?#
Набор данных Caltech-101 включает:
- Около 9 000 цветных изображений, распределенных по 101 категории.
- Категории, охватывающие широкий спектр объектов, включая животных, транспортные средства и предметы домашнего обихода.
- Различное количество изображений в каждой категории, обычно от 40 до 800.
- Изображения разного размера, большинство из которых имеют среднее разрешение.
Эти особенности делают его отличным выбором для обучения и оценки моделей распознавания объектов в области машинного обучения и компьютерного зрения.
Link to this sectionПочему мне следует ссылаться на набор данных Caltech-101 в своем исследовании?#
Ссылка на набор данных Caltech-101 в твоем исследовании подтверждает вклад создателей и предоставляет источник для других исследователей, которые могут использовать этот набор данных. Рекомендуемая форма цитирования:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Цитирование помогает поддерживать добросовестность научной работы и помогает коллегам находить первоисточник.
Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101?#
Да, ты можешь использовать Ultralytics Platform для обучения моделей на наборе данных Caltech-101. Платформа Ultralytics предоставляет интуитивно понятный интерфейс для управления данными, обучения моделей и их развертывания без необходимости написания большого объема кода. Подробное руководство можно найти в блоге как обучать свои собственные модели с помощью Ultralytics Platform.