Перейти к содержимому

Набор данных Caltech-256

Набор данных Caltech-256 - это обширная коллекция изображений, используемых для задач классификации объектов. Она содержит около 30 000 изображений, разделенных на 257 категорий (256 категорий объектов и 1 категория фона). Изображения тщательно подобраны и аннотированы, чтобы обеспечить сложный и разнообразный эталон для алгоритмов распознавания объектов.



Смотри: Как обучить модель классификации изображений на наборе данных Caltech-256 с помощью Ultralytics HUB

Основные характеристики

  • Набор данных Caltech-256 включает в себя около 30 000 цветных изображений, разделенных на 257 категорий.
  • Каждая категория содержит минимум 80 изображений.
  • Категории охватывают широкий спектр объектов реального мира, включая животных, транспортные средства, предметы быта и людей.
  • Изображения могут быть разного размера и разрешения.
  • Caltech-256 широко используется для обучения и тестирования в области машинного обучения, в частности для задач распознавания объектов.

Структура набора данных

Как и в Caltech-101, в наборе данных Caltech-256 нет формального разделения на тренировочный и тестовый наборы. Пользователи обычно создают собственные разделения в соответствии со своими конкретными потребностями. Обычно используется случайное подмножество изображений для обучения, а остальные изображения - для тестирования.

Приложения

Набор данных Caltech-256 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразный набор категорий и высокое качество изображений делают его бесценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов можно найти на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Примеры изображений и аннотаций

Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов, предоставляя обширный набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора данных(зачет):

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая важность разнообразных наборов данных для обучения надежных моделей распознавания объектов.

Цитаты и благодарности

Если ты используешь набор данных Caltech-256 в своих исследованиях или разработках, пожалуйста, ссылайся на следующую статью:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Мы хотели бы выразить благодарность Грегори Гриффину, Алексу Холубу и Пьетро Пероне за создание и поддержку набора данных Caltech-256 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о

Набор данных Caltech-256 и его создатели, посетите сайт Caltech-256 dataset.

ВОПРОСЫ И ОТВЕТЫ

Что такое набор данных Caltech-256 и почему он важен для машинного обучения?

Caltech-256 dataset - это большой набор данных изображений, используемый в основном для задач классификации объектов в машинном обучении и компьютерном зрении. Он состоит примерно из 30 000 цветных изображений, разделенных на 257 категорий, которые охватывают широкий спектр объектов реального мира. Разнообразие и высокое качество изображений делают этот набор отличным эталоном для оценки алгоритмов распознавания объектов, что крайне важно для разработки надежных моделей машинного обучения.

Как обучить модель YOLO на наборе данных Caltech-256, используя Python или CLI?

Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь воспользоваться следующими фрагментами кода. Дополнительные опции см. на странице " Обучение модели".

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Каковы наиболее распространенные варианты использования набора данных Caltech-256?

Набор данных Caltech-256 широко используется для решения различных задач по распознаванию объектов, таких как:

  • Обучение конволюционных нейронных сетей (CNN)
  • Оценка производительности машин с опорными векторами (SVM)
  • Бенчмаркинг новых алгоритмов глубокого обучения
  • Разработка моделей обнаружения объектов с помощью таких фреймворков, как Ultralytics YOLO

Благодаря своему разнообразию и исчерпывающим аннотациям он идеально подходит для исследований и разработок в области машинного обучения и компьютерного зрения.

Как структурирован и разделен набор данных Caltech-256 для обучения и тестирования?

Набор данных Caltech-256 не поставляется с предопределенным разделением для обучения и тестирования. Пользователи обычно создают свои собственные разбиения в соответствии со своими конкретными потребностями. Распространенный подход - случайный выбор подмножества изображений для обучения и использование оставшихся изображений для тестирования. Такая гибкость позволяет пользователям адаптировать набор данных к конкретным требованиям проекта и экспериментальным установкам.

Почему мне стоит использовать Ultralytics YOLO для обучения моделей на наборе данных Caltech-256?

Ultralytics YOLO Модели имеют несколько преимуществ при обучении на наборе данных Caltech-256:

  • Высокая точность: модели YOLO известны своей передовой производительностью в задачах обнаружения объектов.
  • Скорость: они предоставляют возможность делать выводы в режиме реального времени, что делает их подходящими для приложений, требующих быстрых предсказаний.
  • Простота использования: С помощью Ultralytics HUB пользователи могут обучать, проверять и разворачивать модели, не прибегая к обширному кодированию.
  • Предварительно обученные модели: Начиная с предварительно обученных моделей, например yolov8n-cls.pt, может значительно сократить время обучения и повысить точность модели.

Чтобы узнать больше подробностей, изучи наше полное руководство по обучению.



Создано 2023-11-12, Обновлено 2024-07-18
Авторы: RizwanMunawar (1), glenn-jocher (6)

Комментарии