Перейти к содержанию

Набор данных Caltech-256

Набор данных Caltech-256 представляет собой обширную коллекцию изображений, используемых для задач классификации объектов. Она содержит около 30 000 изображений, разделенных на 257 категорий (256 категорий объектов и 1 категория фона). Изображения тщательно подобраны и аннотированы, чтобы обеспечить сложный и разнообразный эталон для алгоритмов распознавания объектов.



Смотреть: Как тренироваться Классификация изображений Модель, использующая набор данных Caltech-256 с Ultralytics HUB

Основные характеристики

  • Набор данных Caltech-256 включает в себя около 30 000 цветных изображений, разделенных на 257 категорий.
  • Каждая категория содержит не менее 80 изображений.
  • Категории охватывают широкий спектр объектов реального мира, включая животных, транспортные средства, предметы быта и людей.
  • Изображения могут быть разного размера и разрешения.
  • Caltech-256 широко используется для обучения и тестирования в области машинного обучения, в частности, для задач распознавания объектов.

Структура набора данных

Как и в Caltech-101, в наборе данных Caltech-256 нет формального разделения на обучающие и тестовые наборы. Пользователи обычно создают свои собственные разделения в соответствии с конкретными потребностями. Обычно используется случайное подмножество изображений для обучения, а остальные изображения - для тестирования.

Приложения

Набор данных Caltech-256 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразный набор категорий и высокое качество изображений делают его бесценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Образцы изображений и аннотаций

Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов и представляет собой обширный набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора(кредит):

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая важность разнообразных наборов данных для обучения надежных моделей распознавания объектов.

Цитаты и благодарности

Если вы используете набор данных Caltech-256 в своих исследованиях или разработках, пожалуйста, ссылайтесь на следующий документ:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Мы хотели бы выразить благодарность Грегори Гриффину, Алексу Холубу и Пьетро Пероне за создание и поддержку набора данных Caltech-256 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о

Сайт набора данных Caltech-256 и его создателей.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Что такое набор данных Caltech-256 и почему он важен для машинного обучения?

Набор данных Caltech-256 - это большой набор данных изображений, используемый в основном для задач классификации объектов в машинном обучении и компьютерном зрении. Он состоит из около 30 000 цветных изображений, разделенных на 257 категорий, охватывающих широкий спектр объектов реального мира. Разнообразие и высокое качество изображений делают этот набор отличным эталоном для оценки алгоритмов распознавания объектов, что очень важно для разработки надежных моделей машинного обучения.

Как обучить модель YOLO на наборе данных Caltech-256, используя Python или CLI?

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, можно использовать следующие фрагменты кода. Дополнительные опции см. на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Каковы наиболее распространенные варианты использования набора данных Caltech-256?

Набор данных Caltech-256 широко используется для решения различных задач распознавания объектов, таких как:

Благодаря разнообразию и обширным аннотациям он идеально подходит для исследований и разработок в области машинного обучения и компьютерного зрения.

Как структурирован и разделен набор данных Caltech-256 для обучения и тестирования?

Набор данных Caltech-256 не поставляется с заранее определенным разделением для обучения и тестирования. Пользователи обычно создают свои собственные разбиения в соответствии с конкретными потребностями. Распространенный подход - случайный выбор подмножества изображений для обучения и использование оставшихся изображений для тестирования. Такая гибкость позволяет пользователям адаптировать набор данных к конкретным требованиям проекта и экспериментальным установкам.

Почему стоит использовать Ultralytics YOLO для обучения моделей на наборе данных Caltech-256?

Ultralytics YOLO Модели имеют ряд преимуществ при обучении на наборе данных Caltech-256:

  • Высокая точность: модели YOLO известны своей высочайшей производительностью в задачах обнаружения объектов.
  • Скорость: они позволяют делать выводы в режиме реального времени, что делает их подходящими для приложений, требующих быстрого прогнозирования.
  • Простота использования: С помощью Ultralytics HUB пользователи могут обучать, проверять и развертывать модели, не прибегая к обширному кодированию.
  • Предварительно обученные модели: Начиная с предварительно обученных моделей, таких как yolo11n-cls.ptпозволяет значительно сократить время обучения и улучшить модель точность.

Для получения более подробной информации изучите наше полное руководство по обучению.

📅 Создано 1 год назад ✏️ Обновлено 3 месяца назад

Комментарии