Link to this sectionНабор данных Caltech-101#
Набор данных Caltech-101 — это широко используемый набор данных для задач распознавания объектов, содержащий около 9 000 изображений из 101 категории объектов. Категории были выбраны так, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и аннотированы, чтобы обеспечить сложный эталон для алгоритмов распознавания объектов.
Набор данных Caltech-101 в исходном виде не содержит заранее определенных выборок для обучения и валидации. Однако при использовании команд обучения, приведенных в примерах ниже, среда Ultralytics автоматически разделит набор данных за тебя. По умолчанию используется разделение: 80% на обучающую выборку и 20% на валидационную.
Link to this sectionКлючевые особенности#
- Набор данных Caltech-101 включает около 9 000 цветных изображений, распределенных по 101 категории.
- Категории охватывают большое разнообразие объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
- Количество изображений в каждой категории варьируется от 40 до 800 штук.
- Изображения имеют переменный размер, при этом большинство из них среднего разрешения.
- Caltech-101 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.
Link to this sectionСтруктура набора данных#
В отличие от многих других наборов данных, Caltech-101 не разделен формально на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разделения исходя из специфических потребностей. Однако распространенной практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.
Link to this sectionПрименение#
Набор данных Caltech-101 активно используется для обучения и оценки моделей глубинного обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), методы опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Широкое разнообразие категорий и высокое качество изображений делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Link to this sectionИспользование#
Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице обучения модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this sectionПримеры изображений и аннотации#
Набор данных Caltech-101 содержит высококачественные цветные изображения различных объектов, предоставляя хорошо структурированные данные для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных Caltech-101 в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Мы хотели бы выразить благодарность Ли Фэй-Фэй, Робу Фергусу и Пьетро Пероне за создание и поддержку набора данных Caltech-101 в качестве ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-101 и его создателях посети веб-сайт набора данных Caltech-101.
Link to this sectionFAQ#
Link to this sectionДля чего используется набор данных Caltech-101 в машинном обучении?#
Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений в 101 категории, обеспечивая сложный эталон для оценки алгоритмов распознавания. Исследователи используют его для обучения и тестирования моделей, особенно сверточных нейронных сетей (CNN) и методов опорных векторов (SVM) в компьютерном зрении.
Link to this sectionКак я могу обучить модель Ultralytics YOLO на наборе данных Caltech-101?#
Чтобы обучить модель Ultralytics YOLO на наборе данных Caltech-101, ты можешь воспользоваться приведенными фрагментами кода. Например, для обучения в течение 100 эпох:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Более подробные аргументы и опции ты найдешь на странице обучения модели.
Link to this sectionКаковы основные характеристики набора данных Caltech-101?#
Набор данных Caltech-101 включает:
- Около 9 000 цветных изображений, распределенных по 101 категории.
- Категории, охватывающие широкий спектр объектов, включая животных, транспортные средства и предметы домашнего обихода.
- Переменное количество изображений в категории, обычно от 40 до 800.
- Изображения с разным размером, большинство из которых среднего разрешения.
Эти характеристики делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.
Link to this sectionПочему мне стоит ссылаться на набор данных Caltech-101 в своем исследовании?#
Ссылаясь на набор данных Caltech-101 в своей работе, ты подтверждаешь вклад его создателей и предоставляешь источник для тех, кто может воспользоваться этим набором. Рекомендуемая ссылка:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Ссылки помогают поддерживать целостность академической работы и помогают коллегам находить оригинальный ресурс.
Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101?#
Да, ты можешь использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101. Платформа Ultralytics предоставляет интуитивно понятный инструмент для управления наборами данных, обучения моделей и их развертывания без необходимости писать много кода. Подробное руководство ищи в блоге как обучать свои собственные модели с помощью платформы Ultralytics.