Link to this sectionНабор данных Caltech-256#
Набор данных Caltech-256 — это обширная коллекция изображений, используемая для задач классификации объектов. Он содержит около 30 000 изображений, разделенных на 257 категорий (256 категорий объектов и 1 фоновая категория). Изображения тщательно подобраны и размечены, чтобы обеспечить сложный и разнообразный эталон для алгоритмов распознавания объектов.
Набор данных Caltech-256 в исходном виде не содержит предопределенных разбиений на обучающую и валидационную выборки. Однако, когда ты используешь команды обучения, приведенные в примерах ниже, фреймворк Ultralytics автоматически разделит набор данных за тебя. По умолчанию используется разбиение: 80% для обучающей выборки и 20% для валидационной.
Link to this sectionОсновные характеристики#
- Набор данных Caltech-256 состоит из около 30 000 цветных изображений, разделенных на 257 категорий.
- Каждая категория содержит не менее 80 изображений.
- Категории охватывают широкий спектр реальных объектов, включая животных, транспортные средства, предметы домашнего обихода и людей.
- Изображения имеют разный размер и разрешение.
- Caltech-256 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.
Link to this sectionСтруктура набора данных#
Как и Caltech-101, набор данных Caltech-256 не имеет формального разделения на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разбиения в соответствии со своими конкретными потребностями. Распространенная практика — использовать случайное подмножество изображений для обучения, а остальные — для тестирования.
Link to this sectionПриложения#
Набор данных Caltech-256 широко используется для обучения и оценки моделей глубокого обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Его разнообразный набор категорий и высококачественные изображения делают его бесценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Link to this sectionИспользование#
Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Link to this sectionПримеры изображений и аннотаций#
Набор данных Caltech-256 содержит высококачественные цветные изображения различных объектов, предоставляя всесторонний набор данных для задач распознавания объектов. Вот несколько примеров изображений из этого набора (источник):

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-256, подчеркивая важность разнообразного набора данных для обучения надежных моделей распознавания объектов.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных Caltech-256 в своих исследованиях или разработках, пожалуйста, процитируй следующую статью:
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}Мы хотели бы выразить признательность Грегори Гриффину, Алексу Холубу и Пьетро Пероне за создание и поддержку набора данных Caltech-256 в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-256 и его создателях посети сайт набора данных Caltech-256.
Link to this sectionЧасто задаваемые вопросы (FAQ)#
Link to this sectionЧто такое набор данных Caltech-256 и почему он важен для машинного обучения?#
Набор данных Caltech-256 — это большой набор изображений, используемый преимущественно для задач классификации объектов в машинном обучении и компьютерном зрении. Он состоит из около 30 000 цветных изображений, разделенных на 257 категорий, охватывающих широкий спектр реальных объектов. Разнообразные и высококачественные изображения делают этот набор данных отличным эталоном для оценки алгоритмов распознавания объектов, что критически важно для разработки надежных моделей машинного обучения.
Link to this sectionКак я могу обучить модель YOLO на наборе данных Caltech-256 с помощью Python или CLI?#
Чтобы обучить модель YOLO на наборе данных Caltech-256 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Дополнительные параметры ищи на странице Обучение модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Link to this sectionКаковы наиболее распространенные варианты использования набора данных Caltech-256?#
Набор данных Caltech-256 широко используется для различных задач распознавания объектов, таких как:
- Обучение сверточных нейронных сетей (CNN)
- Оценка производительности машин опорных векторов (SVM)
- Бенчмаркинг новых алгоритмов глубокого обучения
- Разработка моделей обнаружения объектов с использованием таких фреймворков, как Ultralytics YOLO
Разнообразие и исчерпывающие аннотации делают его идеальным для исследований и разработок в области машинного обучения и компьютерного зрения.
Link to this sectionКак структурирован набор данных Caltech-256 и как он делится на обучающую и тестовую выборки?#
Набор данных Caltech-256 не поставляется с предопределенным разделением на обучение и тестирование. Пользователи обычно создают свои собственные разбиения в соответствии со своими конкретными потребностями. Распространенный подход — случайный выбор подмножества изображений для обучения и использование оставшихся изображений для тестирования. Эта гибкость позволяет пользователям адаптировать набор данных к конкретным требованиям проекта и экспериментальным установкам.
Link to this sectionПочему мне стоит использовать Ultralytics YOLO для обучения моделей на наборе данных Caltech-256?#
Модели Ultralytics YOLO предлагают несколько преимуществ для обучения на наборе данных Caltech-256:
- Высокая точность: Модели YOLO известны своей передовой производительностью в задачах обнаружения объектов.
- Скорость: Они обеспечивают возможность вывода в режиме реального времени, что делает их подходящими для приложений, требующих быстрых предсказаний.
- Простота использования: С Ultralytics Platform ты можешь обучать, валидировать и развертывать модели без написания большого объема кода.
- Предобученные модели: Использование предобученных моделей, таких как
yolo26n-cls.pt, может значительно сократить время обучения и повысить точность модели.
Для получения дополнительной информации изучи наше полное руководство по обучению и узнай больше о классификации изображений с Ultralytics YOLO.