Перейти к содержимому

Набор данных Caltech-101

Набор данных Caltech-101 - это широко используемый набор данных для задач распознавания объектов, содержащий около 9000 изображений из 101 категории объектов. Категории были выбраны таким образом, чтобы отражать разнообразие объектов реального мира, а сами изображения были тщательно отобраны и аннотированы, чтобы обеспечить сложный эталон для алгоритмов распознавания объектов.

Основные характеристики

  • Набор данных Caltech-101 включает в себя около 9000 цветных изображений, разделенных на 101 категорию.
  • Категории охватывают самые разные предметы, включая животных, транспортные средства, предметы быта и людей.
  • Количество изображений в каждой категории разное, примерно от 40 до 800 изображений в каждой категории.
  • Изображения могут быть разного размера, большинство из них - среднего разрешения.
  • Caltech-101 широко используется для обучения и тестирования в области машинного обучения, в частности для задач распознавания объектов.

Структура набора данных

В отличие от многих других наборов данных, набор Caltech-101 не имеет формального разделения на тренировочный и тестовый наборы. Пользователи обычно создают свои собственные разбиения, исходя из своих конкретных потребностей. Однако общепринятой практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.

Приложения

Набор данных Caltech-101 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Широкое разнообразие категорий и высокое качество изображений делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов можно найти на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Примеры изображений и аннотаций

Набор данных Caltech-101 содержит высококачественные цветные изображения различных объектов, представляя собой хорошо структурированный набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразных наборов данных для обучения надежных моделей распознавания объектов.

Цитаты и благодарности

Если ты используешь набор данных Caltech-101 в своих исследованиях или разработках, пожалуйста, ссылайся на следующую статью:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Мы хотели бы выразить благодарность Ли Фей-Фею, Робу Фергусу и Пьетро Пероне за создание и поддержку набора данных Caltech-101 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Более подробную информацию о наборе данных Caltech-101 и его создателях можно найти на сайте Caltech-101 dataset.

ВОПРОСЫ И ОТВЕТЫ

Для чего используется набор данных Caltech-101 в машинном обучении?

Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений по 101 категории, представляя собой сложный эталон для оценки алгоритмов распознавания объектов. Исследователи используют его для обучения и тестирования моделей, особенно конволюционных нейронных сетей (CNN) и машин с опорными векторами (SVM), в компьютерном зрении.

Как обучить модель Ultralytics YOLO на наборе данных Caltech-101?

Чтобы обучить модель Ultralytics YOLO на наборе данных Caltech-101, ты можешь воспользоваться предоставленными фрагментами кода. Например, для обучения на 100 эпох:

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Более подробные аргументы и опции ты найдешь на странице обучения модели.

Каковы ключевые особенности набора данных Caltech-101?

The Caltech-101 dataset includes:

  • Around 9,000 color images across 101 categories.
  • Categories covering a diverse range of objects, including animals, vehicles, and household items.
  • Variable number of images per category, typically between 40 and 800.
  • Variable image sizes, with most being medium resolution.

Эти особенности делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.

Почему я должен ссылаться на набор данных Caltech-101 в своих исследованиях?

Цитирование набора данных Caltech-101 в твоих исследованиях подтверждает вклад создателей и служит ссылкой для других людей, которые могут использовать этот набор данных. Рекомендуется использовать следующие цитаты:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Цитирование помогает сохранить целостность академической работы и помогает коллегам найти оригинальный ресурс.

Могу ли я использовать Ultralytics HUB для обучения моделей на наборе данных Caltech-101?

Да, ты можешь использовать Ultralytics HUB для обучения моделей на наборе данных Caltech-101. Ultralytics HUB предоставляет интуитивно понятную платформу для управления наборами данных, обучения моделей и их развертывания без обширного кодирования. Подробное руководство см. в бло ге Ultralytics HUB в статье "Как обучать пользовательские модели с помощью HUB".


📅 Created 10 months ago ✏️ Updated 3 days ago

Комментарии