Набор данных Caltech-101

Q: What are the key features of the Caltech-101 dataset?

Набор данных Caltech-101 включает в себя: Эти функции делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.

Q: Why should I cite the Caltech-101 dataset in my research?

Цитирование набора данных Caltech-101 в вашем исследовании подтверждает вклад создателей и предоставляет ссылку для других, кто может использовать этот набор данных. Рекомендуемая цитата: Цитирование помогает поддерживать целостность академической работы и помогает коллегам находить исходный ресурс.

Q: Can I use Ultralytics Platform for training models on the Caltech-101 dataset?

Да, вы можете использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101. Платформа Ultralytics предоставляет интуитивно понятную платформу для управления наборами данных, обучения моделей и их развертывания без обширного кодирования. Подробное руководство см. в статье в блоге «Как обучать свои пользовательские модели с помощью платформы Ultralytics».

Набор данных Caltech-101 широко используется для задач распознавания объектов и содержит около 9 000 изображений, относящихся к 101 категории объектов. Категории были выбраны таким образом, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и аннотированы, чтобы обеспечить сложную задачу для алгоритмов распознавания объектов.

Смотреть: Как обучать Классификация изображений Модель, использующая набор данных Caltech-256 с платформой Ultralytics

Автоматическое разделение данных

Набор данных Caltech-101 в предоставленном виде не имеет предопределенных разделений на обучающую и проверочную выборки. Однако, когда вы используете команды обучения, приведенные в примерах использования ниже, фреймворк Ultralytics автоматически разделит набор данных для вас. По умолчанию используется разделение 80% для обучающего набора и 20% для проверочного набора.

Основные характеристики

Набор данных Caltech-101 содержит около 9 000 цветных изображений, разделенных на 101 категорию.
Категории охватывают широкий спектр объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
Количество изображений в каждой категории варьируется, составляя от 40 до 800 изображений.
Изображения имеют разные размеры, при этом большинство изображений имеют среднее разрешение.
Caltech-101 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.

Структура набора данных

В отличие от многих других наборов данных, набор данных Caltech-101 формально не разделен на наборы для обучения и тестирования. Пользователи обычно создают свои собственные разделения в зависимости от своих конкретных потребностей. Однако обычной практикой является использование случайного подмножества изображений для обучения (например, 30 изображений на категорию) и оставшихся изображений для тестирования.

Приложения

Датасет Caltech-101 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Широкое разнообразие категорий и высококачественные изображения делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.

Пример обучения

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo26n-cls.pt epochs=100 imgsz=416

Примеры изображений и аннотации

Датасет Caltech-101 содержит высококачественные цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:

Примеры набора данных Caltech-101 для классификации изображений

Пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.

Цитирование и благодарности

Если вы используете набор данных Caltech-101 в своей исследовательской или опытно-конструкторской работе, пожалуйста, сошлитесь на следующую статью:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Мы хотели бы поблагодарить Ли Фей-Фей, Роба Фергюса и Пьетро Перона за создание и поддержку набора данных Caltech-101 в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-101 и его создателях посетите веб-сайт набора данных Caltech-101.

Часто задаваемые вопросы

Для чего используется набор данных Caltech-101 в машинном обучении?

Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений в 101 категории, что обеспечивает сложный эталон для оценки алгоритмов распознавания объектов. Исследователи используют его для обучения и тестирования моделей, особенно сверточных нейронных сетей (CNN) и машин опорных векторов (SVM) в компьютерном зрении.

Как обучить модель Ultralytics YOLO на наборе данных Caltech-101?

Чтобы обучить модель Ultralytics YOLO на наборе данных Caltech-101, вы можете использовать предоставленные фрагменты кода. Например, для обучения в течение 100 эпох:

Пример обучения

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo26n-cls.pt epochs=100 imgsz=416

Для получения более подробной информации об аргументах и параметрах обратитесь к странице Обучение модели.

Каковы ключевые особенности набора данных Caltech-101?

Набор данных Caltech-101 включает в себя:

Около 9 000 цветных изображений по 101 категории.
Категории, охватывающие широкий спектр объектов, включая животных, транспортные средства и предметы домашнего обихода.
Переменное количество изображений на категорию, обычно от 40 до 800.
Различные размеры изображений, в основном среднего разрешения.

Эти функции делают его отличным выбором для обучения и оценки моделей распознавания объектов в машинном обучении и компьютерном зрении.

Почему следует ссылаться на набор данных Caltech-101 в моих исследованиях?

Указание набора данных Caltech-101 в вашем исследовании подтверждает вклад создателей и предоставляет ссылку для других, кто может использовать этот набор данных. Рекомендуемая цитата:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Цитирование помогает поддерживать целостность академической работы и помогает коллегам находить первоначальный ресурс.

Могу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101?

Да, вы можете использовать Платформу Ultralytics для обучения моделей на наборе данных Caltech-101. Платформа Ultralytics предоставляет интуитивно понятную платформу для управления наборами данных, обучения моделей и их развертывания без обширного кодирования. Подробное руководство см. в статье в блоге «Как обучать свои пользовательские модели с помощью платформы Ultralytics».

📅 Создано 2 лет назад ✏️ Обновлено 3 месяцев назад