Перейти к содержанию

Задачи компьютерного зрения, поддерживаемые Ultralytics YOLO11

Ultralytics YOLO поддерживает задачи компьютерного зрения

Ultralytics YOLO11 - это универсальный фреймворк искусственного интеллекта, который поддерживает множество задач компьютерного зрения. С помощью фреймворка можно выполнять обнаружение, сегментацию, obb, классификацию и оценку позы. Каждая из этих задач имеет свою цель и свой сценарий использования, что позволяет решать различные задачи компьютерного зрения с помощью одного фреймворка.



Смотреть: Изучите сайт Ultralytics YOLO Задачи: Обнаружение объектовСегментация, OBB, отслеживание и оценка позы.

Обнаружение

Обнаружение - основная задача, поддерживаемая YOLO11. Она заключается в определении объектов на изображении или в видеокадре и построении вокруг них ограничительных рамок. Обнаруженные объекты классифицируются по различным категориям на основе их характеристик. YOLO11 может обнаруживать множество объектов на одном изображении или видеокадре с высокой точностью и скоростью, что делает его идеальным для приложений реального времени, таких как системы наблюдения и автономные транспортные средства.

Примеры обнаружения

Сегментация изображений

Сегментация позволяет расширить возможности обнаружения объектов за счет сегментации изображения на различные области на основе их содержания. Каждому региону присваивается метка, что обеспечивает точность на уровне пикселей для таких приложений, как медицинская визуализация, сельскохозяйственный анализ и контроль качества продукции. В YOLO11 реализован вариант архитектуры U-Net для выполнения эффективной и точной сегментации.

Примеры сегментации

Классификация

Классификация подразумевает распределение целых изображений по категориям на основе их содержания. Возможности YOLO11 по классификации используют вариант архитектуры EfficientNet для высокопроизводительной классификации изображений. Эта задача важна для таких приложений, как классификация товаров в электронной коммерции, модерация контента и мониторинг дикой природы.

Примеры классификации

Оценка позы

Оценка позы позволяет обнаружить определенные ключевые точки на изображениях или видеокадрах для отслеживания движений или оценки позы. Эти ключевые точки могут представлять собой суставы человека, черты лица или другие важные точки интереса. YOLO11 отлично справляется с определением ключевых точек с высокой точностью и скоростью, что делает его ценным для фитнес-приложений, спортивной аналитики и взаимодействия человека и компьютера.

Примеры поз

OBB

Обнаружение ориентированных границ (Oriented Bounding Box, OBB) расширяет возможности традиционного обнаружения объектов, добавляя угол ориентации для лучшего обнаружения повернутых объектов. Эта возможность особенно ценна для анализа аэрофотоснимков, обработки документов и промышленных приложений, где объекты появляются под разными углами. YOLO11 обеспечивает высокую точность и скорость обнаружения повернутых объектов в различных сценариях.

Ориентированное обнаружение

Заключение

Ultralytics YOLO11 поддерживает множество задач компьютерного зрения, включая обнаружение, сегментацию, классификацию, обнаружение ориентированных объектов и определение ключевых точек. Каждая задача решает конкретные задачи в области компьютерного зрения - от базовой идентификации объектов до детального анализа позы. Понимая возможности и сферы применения каждой задачи, вы сможете выбрать наиболее подходящий подход для решения ваших конкретных задач компьютерного зрения и использовать мощные возможности YOLO11 для создания эффективных решений.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Какие задачи компьютерного зрения может выполнять Ultralytics YOLO11 ?

Ultralytics YOLO11 это универсальная система искусственного интеллекта, способная выполнять различные задачи компьютерного зрения с высокой точностью и скоростью. К таким задачам относятся:

  • Обнаружение объектов: Идентификация и локализация объектов на изображениях или видеокадрах путем рисования ограничивающих рамок вокруг них.
  • Сегментация изображений: Сегментирование изображений на различные области на основе их содержания, полезное для таких приложений, как медицинская визуализация.
  • Классификация: Классификация целых изображений на основе их содержания с использованием вариантов архитектуры EfficientNet.
  • Оценка позы: Обнаружение определенных ключевых точек в изображении или видеокадре для отслеживания движений или поз.
  • Обнаружение ориентированных объектов (OBB): Обнаружение повернутых объектов с добавлением угла ориентации для повышения точности.

Как использовать Ultralytics YOLO11 для обнаружения объектов?

Чтобы использовать Ultralytics YOLO11 для обнаружения объектов, выполните следующие действия:

  1. Подготовьте набор данных в соответствующем формате.
  2. Обучите модель YOLO11 , используя задачу обнаружения.
  3. Используйте модель для составления прогнозов, вводя новые изображения или видеокадры.

Пример

from ultralytics import YOLO

# Load a pre-trained YOLO model (adjust model type as needed)
model = YOLO("yolo11n.pt")  # n, s, m, l, x versions available

# Perform object detection on an image
results = model.predict(source="image.jpg")  # Can also use video, directory, URL, etc.

# Display the results
results[0].show()  # Show the first image results
# Run YOLO detection from the command line
yolo detect model=yolo11n.pt source="image.jpg" # Adjust model and source as needed

Для получения более подробных инструкций ознакомьтесь с нашими примерами обнаружения.

В чем преимущества использования YOLO11 для решения задач сегментации?

Использование сайта YOLO11 для решения задач сегментации дает несколько преимуществ:

  1. Высокая точность: В задаче сегментации используется вариант архитектуры U-Net для достижения точной сегментации.
  2. Скорость: YOLO11 оптимизирован для работы в режиме реального времени и обеспечивает быструю обработку даже изображений высокого разрешения.
  3. Множество применений: Он идеально подходит для медицинской визуализации, автономного вождения и других приложений, требующих детальной сегментации изображений.

Подробнее о преимуществах и вариантах использования YOLO11 для сегментации можно узнать в разделе "Сегментация изображений".

Может ли Ultralytics YOLO11 справиться с оценкой положения и определением ключевых точек?

Да, Ultralytics YOLO11 может эффективно выполнять оценку позы и обнаружение ключевых точек с высокой точностью и скоростью. Эта функция особенно полезна для отслеживания движений в спортивной аналитике, здравоохранении и приложениях взаимодействия человека и компьютера. YOLO11 обнаруживает ключевые точки в изображении или видеокадре, что позволяет точно оценить позу.

Для получения более подробной информации и советов по реализации посетите наши примеры оценки позы.

Почему стоит выбрать Ultralytics YOLO11 для обнаружения ориентированных объектов (OBB)?

Функция обнаружения ориентированных объектов (OBB) с YOLO11 обеспечивает повышенную точность за счет обнаружения объектов с дополнительным угловым параметром. Эта функция полезна для приложений, требующих точной локализации повернутых объектов, таких как анализ аэрофотоснимков и автоматизация складов.

  • Повышенная точность: Компонент угла уменьшает количество ложных срабатываний для повернутых объектов.
  • Универсальное применение: Пригодится для задач геопространственного анализа, робототехники и т.д.

Более подробную информацию и примеры смотрите в разделе "Обнаружение ориентированных объектов".

📅 Создано 1 год назад ✏️ Обновлено 1 день назад

Комментарии