Link to this sectionНабор данных Caltech-101#

Набор данных Caltech-101 — это классический бенчмарк для классификации изображений, состоящий из 9144 изображений, охватывающих 101 категорию объектов и один фоновый класс. В каждой категории содержится от 40 до 800 изображений реальных объектов — животных, транспортных средств, предметов домашнего обихода и людей, — что делает его компактным, но сложным бенчмарком для моделей распознавания объектов.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

Автоматическое разделение данных

Caltech-101 поставляется без заранее заданного разделения на обучающую и валидационную выборки. Приведенные ниже команды обучения автоматически разделяют его в пропорции 80% для обучения и 20% для валидации, поэтому ручная подготовка не требуется.

Link to this sectionКлючевые особенности#

Caltech-101 содержит 9144 цветных изображения, распределенных по 101 категории объектов и одному классу BACKGROUND_Google (всего 102 папки с классами).
Категории охватывают большое разнообразие реальных объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
Каждая категория содержит от 40 до 800 изображений, поэтому размеры классов несбалансированы.
Изображения имеют разный размер, в основном около 300x200 пикселей (среднее разрешение).
Caltech-101 широко используется для тестирования алгоритмов классификации изображений и распознавания объектов.

Link to this sectionСтруктура набора данных#

Caltech-101 распространяется в виде 102 папок — по одной на класс, включая 101 категорию объектов и один класс BACKGROUND_Google — без заранее заданного разделения на обучающую и валидационную выборки. Когда ты запускаешь обучение, Ultralytics автоматически распределяет изображения, чтобы модели обучались на всех 102 классах без необходимости ручной настройки:

Классы: 102 (101 категория объектов + 1 фоновая)
Всего изображений: 9144
Разделение на обучение/валидацию: автоматически 80% / 20% (≈7280 для обучения, ≈1864 для валидации)
Изображений на класс: от 40 до 800 (несбалансировано)

Link to this sectionПрименение#

Caltech-101 широко используется для обучения и оценки моделей классификации изображений и распознавания объектов, включая сверточные нейронные сети (CNN) и метод опорных векторов (SVM). Широкий охват категорий и качественные размеченные изображения делают его популярным бенчмарком для исследований и прототипирования в области машинного обучения и компьютерного зрения.

Link to this sectionИспользование#

Обучи модель YOLO на Caltech-101 в течение 100 эпох при размере изображения 416. Полный список доступных аргументов можно найти на странице Обучение и в руководстве по задаче классификации изображений.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionПримеры изображений и аннотации#

Набор данных Caltech-101 содержит качественные цветные изображения различных объектов, предоставляя хорошо структурированные данные для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Примеры изображений для классификации из набора Caltech-101

Примеры демонстрируют разнообразие категорий и естественное центрированное кадрирование, типичное для Caltech-101, что делает его удобной отправной точкой для обучения надежных моделей распознавания объектов.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных Caltech-101 в своей исследовательской или проектной работе, пожалуйста, сошлися на следующую публикацию:

Цитата

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Мы хотим выразить признательность Ли Фэй-Фэй, Робу Фергюсу и Пьетро Пероне за создание и поддержку набора данных Caltech-101 в качестве ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-101 и его создателях посети веб-сайт набора данных Caltech-101.

Link to this sectionFAQ#

Link to this sectionДля чего используется набор данных Caltech-101 в машинном обучении?#

Набор данных Caltech-101 широко используется для обучения и тестирования моделей классификации изображений и распознавания объектов. Он содержит 9144 изображения, распределенных по 101 категории объектов и одному фоновому классу, что обеспечивает сложный бенчмарк для оценки таких алгоритмов, как сверточные нейронные сети (CNN) и метод опорных векторов (SVM).

Link to this sectionКак обучить модель Ultralytics YOLO на наборе данных Caltech-101?#

Чтобы обучить модель Ultralytics YOLO на Caltech-101, используй приведенные ниже фрагменты кода. Набор данных загружается автоматически при первом использовании. Полный список аргументов можно найти на странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionСколько классов в наборе данных Caltech-101?#

Caltech-101 содержит 101 категорию объектов и один класс BACKGROUND_Google, что в сумме составляет 102 папки с классами и 9144 изображения. Когда ты обучаешь модель с помощью Ultralytics, она изучает все 102 класса. Размеры категорий несбалансированы: в каждой содержится от 40 до 800 изображений.

Link to this sectionКак набор данных Caltech-101 разделяется на обучающую и валидационную выборки?#

В Caltech-101 нет заранее заданного разделения. При первом запуске обучения Ultralytics автоматически делит данные в пропорции 80% для обучения и 20% для валидации — примерно 7280 изображений для обучения и 1864 для валидации, — поэтому тебе не нужно создавать разделения вручную. Чтобы управлять разделением самостоятельно, организуй изображения по папкам train/ и val/ перед началом обучения.

Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101?#

Да. Платформа Ultralytics позволяет управлять наборами данных, обучать модели классификации изображений и развертывать их без сложного программирования. Это удобный способ проведения экспериментов с Caltech-101 в облаке, а дополнительные возможности можно изучить в нашем обзоре наборов данных для классификации.

Участники

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

Создано 12 нояб. 2023 г.Обновлено вчера