Перейти к содержанию

Задачи компьютерного зрения, поддерживаемые Ultralytics YOLO11

Ultralytics YOLO поддерживает задачи компьютерного зрения

Ultralytics YOLO11 — это универсальная платформа искусственного интеллекта, которая поддерживает несколько задач компьютерного зрения задач. Платформа может использоваться для выполнения обнаружения, сегментации, obb, классификации и оценки позы. Каждая из этих задач имеет разные цели и варианты использования, что позволяет решать различные задачи компьютерного зрения с помощью единой платформы.



Смотреть: Изучите задачи Ultralytics YOLO: Обнаружение объектов, Сегментация, OBB, Отслеживание и Оценка позы.

Обнаружение

Обнаружение — основная задача, поддерживаемая YOLO11. Она включает в себя идентификацию объектов на изображении или видеокадре и рисование ограничивающих рамок вокруг них. Обнаруженные объекты классифицируются по различным категориям на основе их признаков. YOLO11 может обнаруживать несколько объектов на одном изображении или видеокадре с высокой точностью и скоростью, что делает его идеальным для приложений реального времени, таких как системы видеонаблюдения и автономные транспортные средства.

Примеры обнаружения

Сегментация изображений

Сегментация идет дальше обнаружения объектов, разделяя изображение на различные области на основе содержимого. Каждой области присваивается метка, обеспечивающая точность на уровне пикселей для таких приложений, как медицинская визуализация, анализ сельского хозяйства и контроль качества производства. YOLO11 реализует вариант архитектуры U-Net для выполнения эффективной и точной сегментации.

Примеры сегментации

Классификация

Классификация включает в себя категоризацию целых изображений на основе их содержания. Возможности классификации YOLO11 используют вариант архитектуры EfficientNet для обеспечения высокой производительности классификации изображений. Эта задача важна для таких приложений, как категоризация продуктов в электронной коммерции, модерация контента и мониторинг дикой природы.

Примеры классификации

Определение позы

Определение позы обнаруживает определенные ключевые точки на изображениях или видеокадрах для отслеживания движений или оценки поз. Эти ключевые точки могут представлять собой человеческие суставы, черты лица или другие важные точки интереса. YOLO11 превосходно справляется с определением ключевых точек с высокой точностью и скоростью, что делает его ценным для фитнес-приложений, спортивной аналитики и взаимодействия человека с компьютером.

Примеры определения позы

OBB

Обнаружение ориентированных ограничивающих рамок (OBB) улучшает традиционное обнаружение объектов, добавляя угол ориентации для лучшего определения местоположения повернутых объектов. Эта возможность особенно ценна для анализа аэрофотоснимков, обработки документов и промышленных приложений, где объекты отображаются под разными углами. YOLO11 обеспечивает высокую точность и скорость обнаружения повернутых объектов в различных сценариях.

Ориентированное обнаружение

Заключение

Ultralytics YOLO11 поддерживает несколько задач компьютерного зрения, включая обнаружение, сегментацию, классификацию, обнаружение ориентированных объектов и обнаружение ключевых точек. Каждая задача отвечает конкретным потребностям в области компьютерного зрения, от базовой идентификации объектов до детального анализа позы. Понимая возможности и приложения каждой задачи, вы можете выбрать наиболее подходящий подход для решения конкретных задач компьютерного зрения и использовать мощные функции YOLO11 для создания эффективных решений.

Часто задаваемые вопросы

Какие задачи компьютерного зрения может выполнять Ultralytics YOLO11?

Ultralytics YOLO11 — это универсальная платформа искусственного интеллекта, способная выполнять различные задачи компьютерного зрения с высокой точностью и скоростью. Эти задачи включают в себя:

  • Обнаружение объектов: Идентификация и локализация объектов на изображениях или видеокадрах путем рисования ограничивающих рамок вокруг них.
  • Сегментация изображений: Разделение изображений на различные области на основе их содержимого, полезно для таких приложений, как медицинская визуализация.
  • Классификация: Категоризация целых изображений на основе их содержимого с использованием вариантов архитектуры EfficientNet.
  • Оценка позы: Обнаружение определенных ключевых точек на изображении или видеокадре для отслеживания движений или поз.
  • Обнаружение ориентированных объектов (OBB): Обнаружение повернутых объектов с добавленным углом ориентации для повышения точности.

Как использовать Ultralytics YOLO11 для обнаружения объектов?

Чтобы использовать Ultralytics YOLO11 для обнаружения объектов, выполните следующие действия:

  1. Подготовьте свой набор данных в соответствующем формате.
  2. Обучите модель YOLO11, используя задачу обнаружения.
  3. Используйте модель для прогнозирования, подавая новые изображения или видеокадры.

Пример

from ultralytics import YOLO

# Load a pre-trained YOLO model (adjust model type as needed)
model = YOLO("yolo11n.pt")  # n, s, m, l, x versions available

# Perform object detection on an image
results = model.predict(source="image.jpg")  # Can also use video, directory, URL, etc.

# Display the results
results[0].show()  # Show the first image results
# Run YOLO detection from the command line
yolo detect model=yolo11n.pt source="image.jpg" # Adjust model and source as needed

Для получения более подробных инструкций ознакомьтесь с нашими примерами обнаружения.

Каковы преимущества использования YOLO11 для задач сегментации?

Использование YOLO11 для задач сегментации дает несколько преимуществ:

  1. Высокая точность: Задача сегментации использует вариант архитектуры U-Net для достижения точной сегментации.
  2. Скорость: YOLO11 оптимизирована для работы в реальном времени, обеспечивая быструю обработку даже изображений с высоким разрешением.
  3. Разнообразные применения: Идеально подходит для медицинской визуализации, автономного вождения и других приложений, требующих детальной сегментации изображений.

Узнайте больше о преимуществах и вариантах использования YOLO11 для сегментации в разделе о сегментации изображений.

Может ли Ultralytics YOLO11 выполнять оценку позы и обнаружение ключевых точек?

Да, Ultralytics YOLO11 может эффективно выполнять оценку позы и обнаружение ключевых точек с высокой точностью и скоростью. Эта функция особенно полезна для отслеживания движений в спортивной аналитике, здравоохранении и приложениях человеко-компьютерного взаимодействия. YOLO11 обнаруживает ключевые точки на изображении или видеокадре, что позволяет точно оценивать позу.

Для получения более подробной информации и советов по реализации посетите наши примеры оценки позы.

Почему стоит выбрать Ultralytics YOLO11 для обнаружения ориентированных объектов (OBB)?

Обнаружение ориентированных объектов (OBB) с помощью YOLO11 обеспечивает повышенную точность за счет обнаружения объектов с дополнительным угловым параметром. Эта функция полезна для приложений, требующих точной локализации повернутых объектов, таких как анализ аэрофотоснимков и автоматизация складов.

  • Повышенная точность: Угловой компонент снижает количество ложных срабатываний для повернутых объектов.
  • Универсальные приложения: Полезно для задач в геопространственном анализе, робототехнике и т. д.

Подробности и примеры можно найти в разделе Обнаружение ориентированных объектов.



📅 Создано 1 год назад ✏️ Обновлено 5 месяцев назад

Комментарии