Набор данных Caltech-256
Набор данных Caltech-256 — это обширная коллекция изображений, используемая для задач классификации объектов. Он содержит около 30 000 изображений, разделенных на 257 категорий (256 категорий объектов и 1 категория фона). Изображения тщательно отобраны и аннотированы, чтобы обеспечить сложный и разнообразный эталон для алгоритмов распознавания объектов.
Смотреть: Как обучать Классификация изображений Модель, использующая набор данных Caltech-256 с Ultralytics HUB
Автоматическое разделение данных
Набор данных Caltech-256 в предоставленном виде не имеет предопределенных разделений на обучающую и проверочную выборки. Однако, когда вы используете команды обучения, приведенные в примерах использования ниже, фреймворк Ultralytics автоматически разделит набор данных для вас. По умолчанию используется разделение 80% для обучающего набора и 20% для проверочного набора.
Основные характеристики
- Набор данных Caltech-256 содержит около 30 000 цветных изображений, разделенных на 257 категорий.
- Каждая категория содержит минимум 80 изображений.
- Категории охватывают широкий спектр реальных объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
- Изображения имеют различные размеры и разрешения.
- Caltech-256 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.
Структура набора данных
Как и Caltech-101, набор данных Caltech-256 не имеет формального разделения на обучающие и тестовые наборы. Пользователи обычно создают свои собственные разделения в соответствии со своими конкретными потребностями. Распространенной практикой является использование случайного подмножества изображений для обучения и оставшихся изображений для тестирования.
Приложения
Датасет Caltech-256 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразный набор категорий и высококачественные изображения делают его бесценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Использование
Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.
Пример обучения
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
Примеры изображений и аннотации
Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов, предоставляя полный набор данных для задач распознавания объектов. Вот несколько примеров изображений из набора данных (источник):
Пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.
Цитирование и благодарности
Если вы используете набор данных Caltech-256 в своей исследовательской или опытно-конструкторской работе, пожалуйста, процитируйте следующую статью:
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}
Мы хотели бы выразить признательность Грегори Гриффину, Алексу Холубу и Пьетро Перона за создание и поддержку набора данных Caltech-256 в качестве ценного ресурса для сообщества машинного обучения и исследований в области компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-256 и его создателях посетите веб-сайт набора данных Caltech-256.
Часто задаваемые вопросы
Что такое набор данных Caltech-256 и почему он важен для машинного обучения?
Набор данных Caltech-256 — это большой набор изображений, используемый в основном для задач классификации объектов в машинном обучении и компьютерном зрении. Он состоит из примерно 30 000 цветных изображений, разделенных на 257 категорий, охватывающих широкий спектр реальных объектов. Разнообразные и высококачественные изображения в наборе данных делают его отличным эталоном для оценки алгоритмов распознавания объектов, что имеет решающее значение для разработки надежных моделей машинного обучения.
Как я могу обучить модель YOLO на наборе данных Caltech-256 с использованием Python или CLI?
Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, вы можете использовать следующие фрагменты кода. Обратитесь к странице Обучение модели для получения дополнительных опций.
Пример обучения
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
Каковы наиболее распространенные варианты использования набора данных Caltech-256?
Набор данных Caltech-256 широко используется для различных задач распознавания объектов, таких как:
- Обучение сверточных нейронных сетей (CNN)
- Оценка производительности машин опорных векторов (SVM)
- Бенчмаркинг новых алгоритмов глубокого обучения
- Разработка моделей обнаружения объектов с использованием таких фреймворков, как Ultralytics YOLO
Его разнообразие и всесторонние аннотации делают его идеальным для исследований и разработок в области машинного обучения и компьютерного зрения.
Как структурирован и разделен набор данных Caltech-256 для обучения и тестирования?
Набор данных Caltech-256 не поставляется с предопределенным разделением для обучения и тестирования. Пользователи обычно создают свои собственные разделения в соответствии со своими конкретными потребностями. Распространенным подходом является случайный выбор подмножества изображений для обучения и использование оставшихся изображений для тестирования. Эта гибкость позволяет пользователям адаптировать набор данных к своим конкретным требованиям проекта и экспериментальным настройкам.
Почему я должен использовать Ultralytics YOLO для обучения моделей на наборе данных Caltech-256?
Модели Ultralytics YOLO предлагают несколько преимуществ для обучения на наборе данных Caltech-256:
- Высокая точность: Модели YOLO известны своей передовой производительностью в задачах обнаружения объектов.
- Скорость: Они обеспечивают возможности логического вывода в реальном времени, что делает их подходящими для приложений, требующих быстрых прогнозов.
- Простота использования: С Ultralytics HUB пользователи могут обучать, проверять и развертывать модели без обширного кодирования.
- Предварительно обученные модели: Начиная с предварительно обученных моделей, таких как
yolo11n-cls.pt
, может значительно сократить время обучения и улучшить модель точность.
Для получения более подробной информации изучите наше подробное руководство по обучению и узнайте о классификации изображений с помощью Ultralytics YOLO.