Набор данных Caltech-256
Набор данных Caltech-256 — это обширная коллекция изображений, используемая для задач классификации объектов. Он содержит около 30 000 изображений, разделенных на 257 категорий (256 категорий объектов и 1 фоновая категория). Изображения тщательно подобраны и размечены, чтобы обеспечить сложный и разнообразный эталон для алгоритмов распознавания объектов.
Набор данных Caltech-256 в исходном виде не содержит предопределенных разбиений на обучающую и валидационную выборки. Однако, когда ты используешь команды обучения, приведенные в примерах ниже, фреймворк Ultralytics автоматически разделит набор данных за тебя. По умолчанию используется разбиение: 80% для обучающей выборки и 20% для валидационной.
Основные характеристики
- Набор данных Caltech-256 состоит из около 30 000 цветных изображений, разделенных на 257 категорий.
- Каждая категория содержит не менее 80 изображений.
- Категории охватывают широкий спектр реальных объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
- Изображения имеют разный размер и разрешение.
- Caltech-256 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.
Структура набора данных
Как и Caltech-101, набор данных Caltech-256 не имеет формального разделения на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разбиения в соответствии со своими конкретными потребностями. Распространенная практика — использовать случайное подмножество изображений для обучения, а остальные — для тестирования.
Приложения
Набор данных Caltech-256 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Его разнообразный набор категорий и высококачественные изображения делают его бесценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Использование
Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Примеры изображений и аннотаций
Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов, предоставляя всесторонний набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора (источник):

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.
Цитирование и благодарности
Если ты используешь набор данных Caltech-256 в своих исследованиях или разработках, пожалуйста, процитируй следующую статью:
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}Мы хотели бы выразить признательность Грегори Гриффину, Алексу Холубу и Пьетро Пероне за создание и поддержку набора данных Caltech-256 в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-256 и его создателях посети сайт набора данных Caltech-256.
Часто задаваемые вопросы (FAQ)
Что такое набор данных Caltech-256 и почему он важен для машинного обучения?
Набор данных Caltech-256 — это большой набор изображений, используемый преимущественно для задач классификации объектов в машинном обучении и компьютерном зрении. Он состоит из около 30 000 цветных изображений, разделенных на 257 категорий, охватывающих широкий спектр реальных объектов. Разнообразные и высококачественные изображения делают этот набор данных отличным эталоном для оценки алгоритмов распознавания объектов, что критически важно для разработки надежных моделей машинного обучения.
Как я могу обучить модель YOLO на наборе данных Caltech-256 с помощью Python или CLI?
Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Дополнительные параметры ищи на странице Обучение модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Каковы наиболее распространенные варианты использования набора данных Caltech-256?
Набор данных Caltech-256 широко используется для различных задач распознавания объектов, таких как:
- Обучение сверточных нейронных сетей (CNN)
- Оценка производительности машин опорных векторов (SVM)
- Бенчмаркинг новых алгоритмов глубокого обучения
- Разработка моделей обнаружения объектов с использованием таких фреймворков, как Ultralytics YOLO
Разнообразие и исчерпывающие аннотации делают его идеальным для исследований и разработок в области машинного обучения и компьютерного зрения.
Как структурирован набор данных Caltech-256 и как он делится на обучающую и тестовую выборки?
Набор данных Caltech-256 не поставляется с предопределенным разделением на обучение и тестирование. Пользователи обычно создают свои собственные разбиения в соответствии со своими конкретными потребностями. Распространенный подход — случайный выбор подмножества изображений для обучения и использование оставшихся изображений для тестирования. Эта гибкость позволяет пользователям адаптировать набор данных к конкретным требованиям проекта и экспериментальным установкам.
Почему мне стоит использовать Ultralytics YOLO для обучения моделей на наборе данных Caltech-256?
Модели Ultralytics YOLO предлагают несколько преимуществ для обучения на наборе данных Caltech-256:
- Высокая точность: Модели YOLO известны своей передовой производительностью в задачах обнаружения объектов.
- Скорость: Они обеспечивают возможность вывода в режиме реального времени, что делает их подходящими для приложений, требующих быстрых предсказаний.
- Простота использования: С Ultralytics Platform ты можешь обучать, валидировать и развертывать модели без написания большого объема кода.
- Предобученные модели: Использование предобученных моделей, таких как
yolo26n-cls.pt, может значительно сократить время обучения и повысить точность модели.
Для получения дополнительной информации изучи наше полное руководство по обучению и узнай больше о классификации изображений с Ultralytics YOLO.