Руководство по тестированию модели

Q: How can I test my Ultralytics YOLO26 model on multiple images?

Чтобы протестировать вашу модель Ultralytics YOLO26 на нескольких изображениях, вы можете использовать режим prediction. Этот режим позволяет запускать модель на новых, невиданных данных для генерации predictions без предоставления подробных метрик. Это идеально подходит для тестирования производительности в реальных условиях на больших наборах изображений, хранящихся в папке. Для оценки метрик производительности используйте вместо этого режим validation.

Q: What should I do if my computer vision model shows signs of overfitting or underfitting?

Для устранения переобучения: Для устранения недообучения: Просматривайте неправильно классифицированные изображения, проводите тщательный анализ ошибок и регулярно отслеживайте показатели производительности для поддержания баланса. Для получения дополнительной информации об этих понятиях изучите наш раздел о переобучении и недообучении.

Q: How can I detect and avoid data leakage in computer vision?

Чтобы detect утечку данных: Чтобы избежать утечки данных: Подробные стратегии предотвращения утечки данных см. в нашем разделе об утечке данных в компьютерном зрении.

Q: How do I run YOLO26 predictions without custom training?

Вы можете запустить predictions с использованием предварительно обученной модели YOLO26 на вашем наборе данных, чтобы увидеть, соответствует ли она потребностям вашего приложения. Используйте режим prediction, чтобы быстро оценить результаты производительности, не углубляясь в пользовательское обучение.

Введение

После обучения и оценки вашей модели, пришло время ее протестировать. Тестирование модели включает в себя оценку того, насколько хорошо она работает в реальных сценариях. При тестировании учитываются такие факторы, как точность, надежность, справедливость и то, насколько легко понять решения модели. Цель состоит в том, чтобы убедиться, что модель работает должным образом, обеспечивает ожидаемые результаты и соответствует общей цели вашего приложения или проекта.

Смотреть: Как тестировать модели машинного обучения | Избегайте утечки данных в компьютерном зрении 🚀

Тестирование модели очень похоже на оценку модели, но это два разных этапа в проекте компьютерного зрения. Оценка модели включает в себя метрики и графики для оценки точности модели. С другой стороны, тестирование модели проверяет, соответствует ли изученное моделью поведение ожиданиям. В этом руководстве мы рассмотрим стратегии тестирования ваших моделей компьютерного зрения.

Тестирование модели в сравнении с оценкой модели

Сначала давайте разберемся с разницей между оценкой и тестированием модели на примере.

Предположим, вы обучили модель компьютерного зрения для распознавания кошек и собак и хотите развернуть эту модель в зоомагазине для наблюдения за животными. На этапе оценки модели вы используете размеченный набор данных для расчета таких метрик, как точность (accuracy), точность (precision), полнота (recall) и F1-мера. Например, модель может иметь точность 98% в различении кошек и собак в данном наборе данных.

После оценки вы тестируете модель, используя изображения из зоомагазина, чтобы увидеть, насколько хорошо она идентифицирует кошек и собак в более разнообразных и реалистичных условиях. Вы проверяете, может ли она правильно маркировать кошек и собак, когда они двигаются, в различных условиях освещения или частично закрыты такими объектами, как игрушки или мебель. Тестирование модели проверяет, ведет ли себя модель так, как ожидалось, за пределами контролируемой среды оценки.

Подготовка к тестированию модели

Модели компьютерного зрения обучаются на наборах данных, выявляя закономерности, делая прогнозы и оценивая свою производительность. Эти наборы данных обычно разделены на обучающие и тестовые наборы для имитации реальных условий. Обучающие данные учат модель, а тестовые данные проверяют ее точность.

Вот два момента, которые следует учитывать перед тестированием вашей модели:

Реалистичное представление: Ранее невидимые тестовые данные должны быть похожи на данные, с которыми модели придется работать при развертывании. Это помогает получить реалистичное представление о возможностях модели.
Достаточный размер: Размер тестового набора данных должен быть достаточно большим, чтобы обеспечить надежное понимание того, насколько хорошо работает модель.

Тестирование вашей модели компьютерного зрения

Вот основные шаги, которые необходимо предпринять, чтобы протестировать вашу модель компьютерного зрения и понять ее производительность.

Запуск прогнозов: Используйте модель для создания прогнозов на тестовом наборе данных.
Сравнение прогнозов: Проверьте, насколько хорошо прогнозы модели соответствуют фактическим меткам (ground truth).
Calculate Performance Metrics:Вычислите метрики, такие как точность, precision, recall и F1 score, чтобы понять сильные и слабые стороны модели. Тестирование фокусируется на том, как эти метрики отражают реальную производительность.
Визуализируйте результаты: Создавайте визуальные средства, такие как матрицы ошибок и ROC-кривые. Они помогают выявить конкретные области, в которых модель может работать недостаточно хорошо в практических приложениях.

Далее, результаты тестирования можно проанализировать:

Неправильно классифицированные изображения: Выявляйте и просматривайте изображения, которые модель неправильно классифицировала, чтобы понять, в чем ее ошибка.
Анализ ошибок: Проведите тщательный анализ ошибок, чтобы понять типы ошибок (например, ложноположительные и ложноотрицательные результаты) и их потенциальные причины.
Предвзятость и справедливость: Проверьте наличие каких-либо отклонений в прогнозах модели. Убедитесь, что модель одинаково хорошо работает на разных подмножествах данных, особенно если они включают конфиденциальные атрибуты, такие как раса, пол или возраст.

Тестирование вашей модели YOLO26

Чтобы протестировать вашу модель YOLO26, вы можете использовать режим validation. Это простой способ понять сильные стороны модели и области, требующие улучшения. Кроме того, вам потребуется правильно отформатировать ваш тестовый набор данных для YOLO26. Для получения более подробной информации о том, как использовать режим validation, ознакомьтесь со страницей документации Model Validation.

Использование YOLO26 для Predict на нескольких тестовых изображениях

Если вы хотите протестировать свою обученную модель YOLO26 на нескольких изображениях, хранящихся в папке, вы можете легко сделать это за один раз. Вместо использования режима validation, который обычно используется для оценки производительности модели на validation наборе и предоставления подробных метрик, вы можете просто захотеть увидеть predictions на всех изображениях в вашем тестовом наборе. Для этого вы можете использовать режим prediction.

Разница между режимами валидации и прогнозирования

Режим валидации: Используется для оценки производительности модели путем сравнения предсказаний с известными метками (истиной). Он предоставляет подробные метрики, такие как точность, precision, recall и F1-мера.
Режим предсказания: Используется для запуска модели на новых, ранее невидимых данных для генерации предсказаний. Он не предоставляет подробных метрик производительности, но позволяет увидеть, как модель работает на реальных изображениях.

Запуск YOLO26 Predictions без пользовательского обучения

Если вы заинтересованы в тестировании базовой модели YOLO26, чтобы понять, можно ли ее использовать для вашего приложения без пользовательского обучения, вы можете использовать режим prediction. Хотя модель предварительно обучена на таких наборах данных, как COCO, запуск predictions на вашем собственном наборе данных может дать вам быстрое представление о том, насколько хорошо она может работать в вашем конкретном контексте.

Переобучение и недообучение в машинном обучении

При тестировании модели машинного обучения, особенно в компьютерном зрении, важно следить за переобучением и недообучением. Эти проблемы могут существенно повлиять на то, насколько хорошо ваша модель работает с новыми данными.

Переобучение

Переобучение происходит, когда ваша модель слишком хорошо изучает обучающие данные, включая шум и детали, которые не обобщаются на новые данные. В компьютерном зрении это означает, что ваша модель может отлично работать с обучающими изображениями, но испытывать трудности с новыми.

Признаки переобучения

Высокая точность обучения, низкая точность валидации: Если ваша модель очень хорошо работает на данных обучения, но плохо на данных валидации или тестовых данных, это, вероятно, переобучение.
Визуальный осмотр: Иногда можно увидеть переобучение, если ваша модель слишком чувствительна к незначительным изменениям или нерелевантным деталям на изображениях.

Недообучение

Недообучение возникает, когда ваша модель не может уловить основные закономерности в данных. В компьютерном зрении недообученная модель может даже неправильно распознавать объекты на обучающих изображениях.

Признаки недообучения

Низкая точность обучения: Если ваша модель не может достичь высокой точности на обучающем наборе, возможно, она недообучается.
Визуальная неправильная классификация: Постоянная неспособность распознавать очевидные признаки или объекты предполагает недообучение.

Балансировка переобучения и недообучения

Ключевым моментом является нахождение баланса между переобучением и недообучением. В идеале модель должна хорошо работать как на обучающем, так и на проверочном наборах данных. Регулярный мониторинг производительности вашей модели с помощью метрик и визуальных проверок, а также применение правильных стратегий помогут вам достичь наилучших результатов.

Визуализация переобучения против недообучения

Утечка данных в компьютерном зрении и как ее избежать

При тестировании вашей модели важно помнить об утечке данных. Утечка данных происходит, когда информация извне обучающего набора данных случайно используется для обучения модели. Модель может казаться очень точной во время обучения, но она не будет хорошо работать с новыми, невиданными данными при возникновении утечки данных.

Почему происходит утечка данных

Утечку данных может быть сложно обнаружить, и часто она возникает из-за скрытых смещений в обучающих данных. Вот некоторые распространенные способы, которыми это может произойти в компьютерном зрении:

Смещение камеры: Различные углы, освещение, тени и движения камеры могут создавать нежелательные закономерности.
Смещение наложения: Логотипы, отметки времени или другие наложения на изображениях могут ввести модель в заблуждение.
Шрифт и предвзятость к объектам: Определенные шрифты или объекты, которые часто появляются в определенных классах, могут исказить обучение модели.
Пространственное смещение: Дисбаланс между передним и задним планом, распределения ограничивающих прямоугольников и местоположения объектов могут повлиять на обучение.
Предвзятость в разметке и данных: Неправильные метки или сдвиги в типах данных могут привести к утечке.

Обнаружение утечки данных

Чтобы найти утечку данных, вы можете:

Проверка производительности: Если результаты модели на удивление хороши, это может быть утечка.
Оценка важности признаков: Если один признак намного важнее других, это может указывать на утечку данных.
Визуальный осмотр: Перепроверьте, чтобы решения модели интуитивно имели смысл.
Проверка разделения данных: Убедитесь, что данные были разделены правильно перед любой обработкой.

Предотвращение утечки данных

Чтобы предотвратить утечку данных, используйте разнообразный набор данных с изображениями или видео, полученными с разных камер и в разных условиях. Тщательно проверьте свои данные и убедитесь, что в них нет скрытых смещений, например, когда все положительные примеры взяты в определенное время суток. Предотвращение утечки данных поможет сделать ваши модели компьютерного зрения более надежными и эффективными в реальных условиях.

Что идет после тестирования модели

После тестирования вашей модели следующие шаги зависят от результатов. Если ваша модель работает хорошо, вы можете развернуть ее в реальной среде. Если результаты неудовлетворительны, вам нужно будет внести улучшения. Это может включать анализ ошибок, сбор дополнительных данных, улучшение качества данных, настройку гиперпараметров и переобучение модели.

Присоединяйтесь к обсуждению об ИИ

Участие в сообществе энтузиастов компьютерного зрения может помочь в решении проблем и более эффективном обучении. Вот несколько способов связаться, обратиться за помощью и поделиться своими мыслями.

Ресурсы сообщества

GitHub Issues: Изучите репозиторий YOLO26 на GitHub и используйте вкладку Issues, чтобы задавать вопросы, сообщать об ошибках и предлагать новые функции. Сообщество и сопровождающие очень активны и готовы помочь.
Сервер Ultralytics Discord: Присоединяйтесь к серверу Ultralytics Discord, чтобы общаться с другими пользователями и разработчиками, получать поддержку и делиться своим опытом.

Официальная документация

Документация Ultralytics YOLO26: Ознакомьтесь с официальной документацией YOLO26 для подробных руководств и полезных советов по различным проектам компьютерного зрения.

Эти ресурсы помогут вам справиться с трудностями и оставаться в курсе последних тенденций и практик в сообществе компьютерного зрения.

В заключение

Создание надежных моделей компьютерного зрения основывается на строгом тестировании моделей. Проверяя модель с ранее невидимыми данными, мы можем проанализировать ее и выявить слабые места, такие как переобучение и утечка данных. Устранение этих проблем перед развертыванием помогает модели хорошо работать в реальных приложениях. Важно помнить, что тестирование модели так же важно, как и оценка модели, для обеспечения долгосрочного успеха и эффективности модели.

Часто задаваемые вопросы

В чем ключевые различия между оценкой модели и тестированием модели в компьютерном зрении?

Оценка модели и тестирование модели — это отдельные этапы в проекте компьютерного зрения. Оценка модели включает в себя использование размеченного набора данных для вычисления метрик, таких как точность, прецизионность, полнота и F1-мера, что позволяет получить представление о производительности модели с помощью контролируемого набора данных. С другой стороны, тестирование модели оценивает производительность модели в реальных сценариях, применяя ее к новым, невидимым данным, гарантируя, что изученное поведение модели соответствует ожиданиям за пределами среды оценки. Подробное руководство см. в разделе об этапах проекта компьютерного зрения.

Как я могу протестировать свою модель Ultralytics YOLO26 на нескольких изображениях?

Для тестирования вашей модели Ultralytics YOLO26 на нескольких изображениях вы можете использовать режим предсказания. Этот режим позволяет запускать модель на новых, ранее не виденных данных для генерации предсказаний без предоставления подробных метрик. Это идеально подходит для тестирования производительности в реальных условиях на больших наборах изображений, хранящихся в папке. Для оценки метрик производительности вместо этого используйте режим валидации.

Что делать, если моя модель компьютерного зрения демонстрирует признаки переобучения или недообучения?

Для решения проблемы переобучения:

Методы регуляризации, такие как dropout.
Увеличьте размер обучающего набора данных.
Упростите архитектуру модели.

Для решения проблемы недообучения:

Используйте более сложную модель.
Предоставьте более релевантные функции.
Увеличьте количество итераций обучения или эпох.

Просматривайте неправильно классифицированные изображения, проводите тщательный анализ ошибок и регулярно отслеживайте показатели производительности для поддержания баланса. Для получения дополнительной информации об этих концепциях изучите наш раздел Переобучение и недообучение.

Как я могу обнаружить и избежать утечки данных в компьютерном зрении?

Чтобы detect утечку данных:

Убедитесь, что производительность тестирования не является необычно высокой.
Проверьте важность признаков для выявления неожиданных закономерностей.
Интуитивно понятный анализ решений модели.
Перед обработкой убедитесь в правильности разделения данных.

Чтобы избежать утечки данных:

Используйте разнообразные наборы данных с различными условиями.
Тщательно проверяйте данные на наличие скрытых искажений.
Убедитесь в отсутствии перекрывающейся информации между наборами для обучения и тестирования.

Подробные стратегии предотвращения утечки данных см. в нашем разделе Утечка данных в компьютерном зрении.

Какие шаги следует предпринять после тестирования моей модели компьютерного зрения?

После тестирования, если производительность модели соответствует целям проекта, переходите к развертыванию. Если результаты неудовлетворительны, рассмотрите:

Анализ ошибок.
Сбор более разнообразных и качественных данных.
Настройка гиперпараметров.
Переобучение модели.

Ознакомьтесь с разделом «Тестирование модели в сравнении с оценкой модели», чтобы улучшить и повысить эффективность модели в реальных приложениях.

Как запустить YOLO26 predictions без пользовательского обучения?

Вы можете запускать предсказания с использованием предварительно обученной модели YOLO26 на вашем наборе данных, чтобы определить, соответствует ли она потребностям вашего приложения. Используйте режим предсказания, чтобы быстро оценить результаты производительности, не углубляясь в пользовательское обучение.

📅 Создано 1 год назад ✏️ Обновлено 3 месяцев назад