Перейти к содержанию

Набор данных Caltech-101

Набор данных Caltech-101 - это широко используемый набор данных для задач распознавания объектов, содержащий около 9 000 изображений из 101 категории объектов. Категории были выбраны таким образом, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и аннотированы, чтобы обеспечить сложный эталон для алгоритмов распознавания объектов.

Основные характеристики

  • Набор данных Caltech-101 включает в себя около 9 000 цветных изображений, разделенных на 101 категорию.
  • Категории охватывают широкий спектр объектов, включая животных, транспортные средства, предметы быта и людей.
  • Количество изображений в каждой категории различно: от 40 до 800 изображений в каждой категории.
  • Изображения имеют разный размер, большинство из них - среднего разрешения.
  • Caltech-101 широко используется для обучения и тестирования в области машинного обучения, в частности, для задач распознавания объектов.

Структура набора данных

В отличие от многих других наборов данных, набор данных Caltech-101 формально не разделен на обучающий и тестовый наборы. Пользователи, как правило, создают свои собственные разбиения, исходя из своих конкретных потребностей. Однако общепринятой практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.

Приложения

Набор данных Caltech-101 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Широкое разнообразие категорий и высокое качество изображений делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Образцы изображений и аннотаций

Набор данных Caltech-101 содержит высококачественные цветные изображения различных объектов и представляет собой хорошо структурированный набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразных наборов данных для обучения надежных моделей распознавания объектов.

Цитаты и благодарности

Если вы используете набор данных Caltech-101 в своих исследованиях или разработках, пожалуйста, ссылайтесь на следующий документ:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Мы хотели бы выразить благодарность Ли Фей-Фею, Робу Фергусу и Пьетро Пероне за создание и поддержку набора данных Caltech-101 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Более подробную информацию о наборе данных Caltech-101 и его создателях можно найти на сайте Caltech-101 dataset.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Для чего используется набор данных Caltech-101 в машинном обучении?

Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений по 101 категории, представляя собой сложный эталон для оценки алгоритмов распознавания объектов. Исследователи используют его для обучения и тестирования моделей, особенно конволюционных нейронных сетей (CNN) и машин с опорными векторами (SVM), в компьютерном зрении.

Как обучить модель Ultralytics YOLO на наборе данных Caltech-101?

Чтобы обучить модель Ultralytics YOLO на наборе данных Caltech-101, вы можете воспользоваться приведенными фрагментами кода. Например, для обучения в течение 100 эпох:

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Более подробные аргументы и опции см. на странице обучения модели.

Каковы ключевые особенности набора данных Caltech-101?

Набор данных Caltech-101 включает в себя:

  • Около 9 000 цветных изображений в 101 категории.
  • Категории, охватывающие разнообразные объекты, включая животных, транспортные средства и предметы быта.
  • Различное количество изображений в каждой категории, обычно от 40 до 800.
  • Размеры изображений различны, большинство из них - среднего разрешения.

Эти особенности делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.

Почему я должен ссылаться на набор данных Caltech-101 в своих исследованиях?

Цитирование набора данных Caltech-101 в ваших исследованиях подтверждает вклад его создателей и служит ссылкой для других людей, которые могут использовать этот набор данных. Рекомендуется использовать следующие ссылки:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Цитирование помогает сохранить целостность научной работы и помогает коллегам найти оригинальный ресурс.

Могу ли я использовать Ultralytics HUB для обучения моделей на наборе данных Caltech-101?

Да, вы можете использовать Ultralytics HUB для обучения моделей на наборе данных Caltech-101. Ultralytics HUB предоставляет интуитивно понятную платформу для управления наборами данных, обучения моделей и их развертывания без обширного кодирования. Подробное руководство см. в статье о том , как обучать пользовательские модели с помощью Ultralytics HUB.

📅 Создано 1 год назад ✏️ Обновлено 2 месяца назад

Комментарии