Отображение объектов в режиме VisionEye с использованием Ultralytics YOLO26 🚀
Что такое отображение объектов VisionEye?
Ultralytics YOLO26 VisionEye предоставляет компьютерам возможность идентифицировать и точно определять объекты, имитируя precision человеческого зрения. Эта функциональность позволяет компьютерам различать и фокусироваться на конкретных объектах, подобно тому, как человеческий глаз наблюдает за деталями с определенной точки обзора.
# Monitor objects position with visioneye
yolo solutions visioneye show=True
# Pass a source video
yolo solutions visioneye source="path/to/video.mp4"
# Monitor the specific classes
yolo solutions visioneye classes="[0, 5]"Аргументы VisionEye
Ниже представлена таблица с аргументами VisionEye:
| Аргумент | Тип | По умолчанию | Описание |
|---|---|---|---|
model | str | None | Путь к файлу модели Ultralytics YOLO. |
vision_point | tuple[int, int] | (20, 20) | Точка, в которой зрение будет отслеживать объекты и рисовать пути с помощью решения VisionEye. |
Ты также можешь использовать различные аргументы track в решении VisionEye:
| Аргумент | Тип | По умолчанию | Описание |
|---|---|---|---|
tracker | str | 'botsort.yaml' | Указывает алгоритм отслеживания, который необходимо использовать, например, bytetrack.yaml или botsort.yaml. |
conf | float | 0.1 | Устанавливает порог достоверности для обнаружения; более низкие значения позволяют отслеживать больше объектов, но могут включать ложные срабатывания. |
iou | float | 0.7 | Устанавливает порог Intersection over Union (IoU) для фильтрации перекрывающихся обнаружений. |
classes | list | None | Фильтрует результаты по индексу класса. Например, classes=[0, 2, 3] отслеживает только указанные классы. |
verbose | bool | True | Управляет отображением результатов отслеживания, предоставляя визуальный вывод отслеживаемых объектов. |
device | str | None | Указывает устройство для вывода (например, cpu, cuda:0 или 0). Позволяет пользователям выбирать между CPU, конкретным GPU или другими вычислительными устройствами для выполнения модели. |
Кроме того, поддерживаются некоторые аргументы визуализации, перечисленные ниже:
| Аргумент | Тип | По умолчанию | Описание |
|---|---|---|---|
show | bool | False | Если True, отображает аннотированные изображения или видео в окне. Полезно для мгновенной визуальной проверки в процессе разработки или тестирования. |
line_width | int or None | None | Задает толщину линий ограничивающих рамок. Если None, толщина подбирается автоматически в зависимости от размера изображения. Обеспечивает визуальную настройку для ясности. |
show_conf | bool | True | Отображает показатель уверенности для каждого обнаруженного объекта рядом с меткой. Дает представление об уверенности модели в каждом обнаружении. |
show_labels | bool | True | Отображает метки для каждого обнаруженного объекта на визуальном выводе. Дает быстрое понимание того, какие объекты были найдены. |
Как работает VisionEye
VisionEye работает путем установки фиксированной точки обзора в кадре и проведения линий от этой точки к обнаруженным объектам. Это имитирует то, как человеческое зрение фокусируется на нескольких объектах с одной точки. Решение использует object tracking для поддержания последовательной идентификации объектов между кадрами, создавая визуальное представление пространственной связи между наблюдателем (точкой обзора) и объектами на сцене.
Метод process в классе VisionEye выполняет несколько ключевых операций:
- Извлекает треки (ограничивающие рамки, классы и маски) из входного изображения
- Создает аннотатор для отрисовки ограничивающих рамок и меток
- Для каждого обнаруженного объекта отрисовывает метку рамки и создает линию обзора от точки обзора
- Возвращает аннотированное изображение со статистикой отслеживания
Этот подход особенно полезен для приложений, требующих пространственного осознания и визуализации взаимосвязей объектов, таких как системы наблюдения, автономная навигация и интерактивные инсталляции.
Приложения VisionEye
Отображение объектов VisionEye имеет множество практических применений в различных отраслях:
- Безопасность и видеонаблюдение: Контролируй несколько интересующих объектов с фиксированной позиции камеры
- Розничная аналитика: Отслеживай модели движения покупателей относительно витрин магазина
- Спортивный анализ: Анализируй позиционирование и перемещение игроков с точки зрения тренера
- Автономные транспортные средства: Визуализируй, как транспортное средство «видит» и расставляет приоритеты объектов в своей среде
- Взаимодействие человека и компьютера: Создавай более интуитивно понятные интерфейсы, которые реагируют на пространственные взаимосвязи
Комбинируя VisionEye с другими решениями Ultralytics, такими как distance calculation или speed estimation, ты можешь создавать комплексные системы, которые не только отслеживают объекты, но и понимают их пространственные взаимосвязи и поведение.
Примечание
По любым вопросам не стесняйся обращаться в раздел Issues Ultralytics или в раздел обсуждений, упомянутый ниже.
Часто задаваемые вопросы (FAQ)
С чего начать использование отображения объектов VisionEye с Ultralytics YOLO26?
Чтобы начать использовать отображение объектов VisionEye с Ultralytics YOLO26, сначала установи пакет Ultralytics YOLO через pip. Затем ты можешь использовать пример кода, предоставленный в документации, для настройки object detection с помощью VisionEye. Вот простой пример для начала:
import cv2
from ultralytics import solutions
cap = cv2.VideoCapture("path/to/video.mp4")
assert cap.isOpened(), "Error reading video file"
# Video writer
w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))
video_writer = cv2.VideoWriter("vision-eye-mapping.avi", cv2.VideoWriter_fourcc(*"mp4v"), fps, (w, h))
# Init vision eye object
visioneye = solutions.VisionEye(
show=True, # display the output
model="yolo26n.pt", # use any model that Ultralytics supports, e.g., YOLOv10
classes=[0, 2], # generate visioneye view for specific classes
)
# Process video
while cap.isOpened():
success, im0 = cap.read()
if not success:
print("Video frame is empty or video processing has been successfully completed.")
break
results = visioneye(im0)
print(results) # access the output
video_writer.write(results.plot_im) # write the video file
cap.release()
video_writer.release()
cv2.destroyAllWindows() # destroy all opened windowsПочему мне стоит использовать Ultralytics YOLO26 для отображения и отслеживания объектов?
Ultralytics YOLO26 славится своей скоростью, accuracy и легкостью интеграции, что делает его лучшим выбором для отображения и отслеживания объектов. Ключевые преимущества включают:
- Современная производительность: Обеспечивает высокую точность обнаружения объектов в реальном времени.
- Гибкость: Поддерживает различные задачи, такие как обнаружение, отслеживание и вычисление расстояния.
- Сообщество и поддержка: Обширная документация и активное сообщество в GitHub для устранения неполадок и улучшений.
- Простота использования: Интуитивно понятный API упрощает выполнение сложных задач, позволяя быстро внедрять и итерировать.
Более подробную информацию о применениях и преимуществах можно найти в документации Ultralytics YOLO26.
Как интегрировать VisionEye с другими инструментами machine learning, такими как Comet или ClearML?
Ultralytics YOLO26 может беспрепятственно интегрироваться с различными инструментами машинного обучения, такими как Comet и ClearML, улучшая отслеживание экспериментов, совместную работу и воспроизводимость. Следуй подробным руководствам как использовать YOLOv5 с Comet и интегрировать YOLO26 с ClearML, чтобы начать.
Для дальнейшего изучения и примеров интеграции ознакомься с нашим Руководством по интеграции Ultralytics.