Перейти к содержимому

Набор данных Caltech-101

Набор данных Caltech-101 - это широко используемый набор данных для задач распознавания объектов, содержащий около 9000 изображений из 101 категории объектов. Категории были выбраны таким образом, чтобы отражать разнообразие объектов реального мира, а сами изображения были тщательно отобраны и аннотированы, чтобы обеспечить сложный эталон для алгоритмов распознавания объектов.

Основные характеристики

  • Набор данных Caltech-101 включает в себя около 9000 цветных изображений, разделенных на 101 категорию.
  • Категории охватывают самые разные предметы, включая животных, транспортные средства, предметы быта и людей.
  • Количество изображений в каждой категории разное, примерно от 40 до 800 изображений в каждой категории.
  • Изображения могут быть разного размера, большинство из них - среднего разрешения.
  • Caltech-101 широко используется для обучения и тестирования в области машинного обучения, в частности для задач распознавания объектов.

Структура набора данных

В отличие от многих других наборов данных, набор Caltech-101 не имеет формального разделения на тренировочный и тестовый наборы. Пользователи обычно создают свои собственные разбиения, исходя из своих конкретных потребностей. Однако общепринятой практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.

Приложения

Набор данных Caltech-101 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Широкое разнообразие категорий и высокое качество изображений делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов можно найти на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Примеры изображений и аннотаций

Набор данных Caltech-101 содержит высококачественные цветные изображения различных объектов, представляя собой хорошо структурированный набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразных наборов данных для обучения надежных моделей распознавания объектов.

Цитаты и благодарности

Если ты используешь набор данных Caltech-101 в своих исследованиях или разработках, пожалуйста, ссылайся на следующую статью:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Мы хотели бы выразить благодарность Ли Фей-Фею, Робу Фергусу и Пьетро Пероне за создание и поддержку набора данных Caltech-101 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Более подробную информацию о наборе данных Caltech-101 и его создателях можно найти на сайте Caltech-101 dataset.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

Комментарии