Meet YOLO26: next-gen vision AI.

Link to this sectionНабор данных Caltech-101#

Набор данных Caltech-101 широко используется для задач распознавания объектов и содержит около 9 000 изображений, распределенных по 101 категории. Категории были выбраны таким образом, чтобы отражать разнообразие реальных объектов, а сами изображения были тщательно отобраны и размечены, чтобы служить сложным эталоном для алгоритмов распознавания объектов.



Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform
Автоматическое разделение данных

Набор данных Caltech-101 в исходном виде не имеет предопределенного разделения на обучающую и валидационную выборки. Однако при использовании команд обучения, приведенных в примерах ниже, фреймворк Ultralytics автоматически разделит набор данных для тебя. По умолчанию используется соотношение 80% для обучающей выборки и 20% для валидационной.

Link to this sectionКлючевые особенности#

  • Набор данных Caltech-101 состоит из около 9 000 цветных изображений, распределенных по 101 категории.
  • Категории включают в себя широкий спектр объектов, в том числе животных, транспортные средства, предметы домашнего обихода и людей.
  • Количество изображений в каждой категории варьируется: от 40 до 800 штук.
  • Изображения имеют разный размер, большинство из них представлены в среднем разрешении.
  • Caltech-101 широко используется для обучения и тестирования в области машинного обучения, особенно для задач распознавания объектов.

Link to this sectionСтруктура набора данных#

В отличие от многих других наборов данных, Caltech-101 официально не разделен на обучающую и тестовую выборки. Пользователи обычно создают свои собственные разделения в зависимости от конкретных нужд. Однако общепринятой практикой является использование случайного подмножества изображений для обучения (например, по 30 изображений на категорию) и оставшихся изображений для тестирования.

Link to this sectionПрименение#

Набор данных Caltech-101 активно используется для обучения и оценки моделей глубинного обучения в задачах распознавания объектов, таких как сверточные нейронные сети (CNNs), метод опорных векторов (SVMs) и другие алгоритмы машинного обучения. Большое разнообразие категорий и высокое качество изображений делают его отличным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Link to this sectionИспользование#

Чтобы обучить модель YOLO на наборе данных Caltech-101 в течение 100 эпох, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов можно найти на странице обучения модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionПримеры изображений и аннотации#

Набор данных Caltech-101 содержит качественные цветные изображения различных объектов, предоставляя хорошо структурированные данные для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Примеры изображений для классификации из набора Caltech-101

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных Caltech-101, подчеркивая важность разнообразных данных для обучения надежных моделей распознавания объектов.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных Caltech-101 в своей исследовательской или проектной работе, пожалуйста, сошлися на следующую публикацию:

Цитата
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Мы хотим выразить признательность Ли Фэй-Фэй, Робу Фергюсу и Пьетро Пероне за создание и поддержку набора данных Caltech-101 в качестве ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных Caltech-101 и его создателях посети веб-сайт набора данных Caltech-101.

Link to this sectionFAQ#

Link to this sectionДля чего используется набор данных Caltech-101 в машинном обучении?#

Набор данных Caltech-101 широко используется в машинном обучении для задач распознавания объектов. Он содержит около 9 000 изображений, распределенных по 101 категории, и является сложным эталоном для оценки алгоритмов распознавания. Исследователи используют его для обучения и тестирования моделей, особенно сверточных нейронных сетей (CNNs) и метода опорных векторов (SVMs) в компьютерном зрении.

Link to this sectionКак обучить модель Ultralytics YOLO на наборе данных Caltech-101?#

Чтобы обучить модель Ultralytics YOLO на наборе данных Caltech-101, ты можешь воспользоваться приведенными фрагментами кода. Например, для обучения в течение 100 эпох:

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Более подробную информацию об аргументах и настройках ты найдешь на странице обучения модели.

Link to this sectionКаковы ключевые особенности набора данных Caltech-101?#

Набор данных Caltech-101 включает:

  • Около 9 000 цветных изображений, распределенных по 101 категории.
  • Категории, охватывающие широкий спектр объектов, включая животных, транспортные средства и предметы домашнего обихода.
  • Различное количество изображений в каждой категории, обычно от 40 до 800.
  • Изображения разного размера, большинство из которых имеют среднее разрешение.

Эти особенности делают его отличным выбором для обучения и оценки моделей распознавания объектов в области машинного обучения и компьютерного зрения.

Link to this sectionПочему мне следует ссылаться на набор данных Caltech-101 в своем исследовании?#

Ссылка на набор данных Caltech-101 в твоем исследовании подтверждает вклад создателей и предоставляет источник для других исследователей, которые могут использовать этот набор данных. Рекомендуемая форма цитирования:

Цитата
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Цитирование помогает поддерживать добросовестность научной работы и помогает коллегам находить первоисточник.

Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на наборе данных Caltech-101?#

Да, ты можешь использовать Ultralytics Platform для обучения моделей на наборе данных Caltech-101. Платформа Ultralytics предоставляет интуитивно понятный интерфейс для управления данными, обучения моделей и их развертывания без необходимости написания большого объема кода. Подробное руководство можно найти в блоге как обучать свои собственные модели с помощью Ultralytics Platform.

Комментарии