VisionEye View Object Mapping с помощью Ultralytics YOLO11 🚀.

Что такое отображение объектов VisionEye?

Ultralytics YOLO11 VisionEye позволяет компьютерам идентифицировать и точно определять объекты, имитируя точность наблюдения человеческого глаза. Эта функция позволяет компьютерам различать и фокусироваться на определенных объектах, подобно тому, как человеческий глаз наблюдает за деталями с определенной точки зрения.

Образцы

VisionEye View	VisionEye View с функцией отслеживания объектов	VisionEye View с расчетом расстояния

VisionEye View Object Mapping с использованием Ultralytics YOLO11	VisionEye View Object Mapping с отслеживанием объектов с помощью Ultralytics YOLO11	VisionEye View с расчетом расстояния с помощью Ultralytics YOLO11

Картирование объектов VisionEye с помощью YOLO11

Картирование объектов VisionEyeКартирование объектов VisionEye с отслеживанием объектовVisionEye с расчетом расстояния

import cv2

from ultralytics import YOLO
from ultralytics.utils.plotting import Annotator, colors

model = YOLO("yolo11n.pt")
names = model.model.names
cap = cv2.VideoCapture("path/to/video/file.mp4")
w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))

out = cv2.VideoWriter("visioneye-pinpoint.avi", cv2.VideoWriter_fourcc(*"MJPG"), fps, (w, h))

center_point = (-10, h)

while True:
    ret, im0 = cap.read()
    if not ret:
        print("Video frame is empty or video processing has been successfully completed.")
        break

    results = model.predict(im0)
    boxes = results[0].boxes.xyxy.cpu()
    clss = results[0].boxes.cls.cpu().tolist()

    annotator = Annotator(im0, line_width=2)

    for box, cls in zip(boxes, clss):
        annotator.box_label(box, label=names[int(cls)], color=colors(int(cls)))
        annotator.visioneye(box, center_point)

    out.write(im0)
    cv2.imshow("visioneye-pinpoint", im0)

    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

out.release()
cap.release()
cv2.destroyAllWindows()

import cv2

from ultralytics import YOLO
from ultralytics.utils.plotting import Annotator, colors

model = YOLO("yolo11n.pt")
cap = cv2.VideoCapture("path/to/video/file.mp4")
w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))

out = cv2.VideoWriter("visioneye-pinpoint.avi", cv2.VideoWriter_fourcc(*"MJPG"), fps, (w, h))

center_point = (-10, h)

while True:
    ret, im0 = cap.read()
    if not ret:
        print("Video frame is empty or video processing has been successfully completed.")
        break

    annotator = Annotator(im0, line_width=2)

    results = model.track(im0, persist=True)
    boxes = results[0].boxes.xyxy.cpu()

    if results[0].boxes.id is not None:
        track_ids = results[0].boxes.id.int().cpu().tolist()

        for box, track_id in zip(boxes, track_ids):
            annotator.box_label(box, label=str(track_id), color=colors(int(track_id)))
            annotator.visioneye(box, center_point)

    out.write(im0)
    cv2.imshow("visioneye-pinpoint", im0)

    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

out.release()
cap.release()
cv2.destroyAllWindows()

import math

import cv2

from ultralytics import YOLO
from ultralytics.utils.plotting import Annotator

model = YOLO("yolo11n.pt")
cap = cv2.VideoCapture("Path/to/video/file.mp4")

w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))

out = cv2.VideoWriter("visioneye-distance-calculation.avi", cv2.VideoWriter_fourcc(*"MJPG"), fps, (w, h))

center_point = (0, h)
pixel_per_meter = 10

txt_color, txt_background, bbox_clr = ((0, 0, 0), (255, 255, 255), (255, 0, 255))

while True:
    ret, im0 = cap.read()
    if not ret:
        print("Video frame is empty or video processing has been successfully completed.")
        break

    annotator = Annotator(im0, line_width=2)

    results = model.track(im0, persist=True)
    boxes = results[0].boxes.xyxy.cpu()

    if results[0].boxes.id is not None:
        track_ids = results[0].boxes.id.int().cpu().tolist()

        for box, track_id in zip(boxes, track_ids):
            annotator.box_label(box, label=str(track_id), color=bbox_clr)
            annotator.visioneye(box, center_point)

            x1, y1 = int((box[0] + box[2]) // 2), int((box[1] + box[3]) // 2)  # Bounding box centroid

            distance = (math.sqrt((x1 - center_point[0]) ** 2 + (y1 - center_point[1]) ** 2)) / pixel_per_meter

            text_size, _ = cv2.getTextSize(f"Distance: {distance:.2f} m", cv2.FONT_HERSHEY_SIMPLEX, 1.2, 3)
            cv2.rectangle(im0, (x1, y1 - text_size[1] - 10), (x1 + text_size[0] + 10, y1), txt_background, -1)
            cv2.putText(im0, f"Distance: {distance:.2f} m", (x1, y1 - 5), cv2.FONT_HERSHEY_SIMPLEX, 1.2, txt_color, 3)

    out.write(im0)
    cv2.imshow("visioneye-distance-calculation", im0)

    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

out.release()
cap.release()
cv2.destroyAllWindows()

`visioneye` Аргументы

Имя	Тип	По умолчанию	Описание
`color`	`tuple`	`(235, 219, 11)`	Цвет центроида линии и объекта
`pin_color`	`tuple`	`(255, 0, 255)`	Точечный цвет VisionEye

Примечание

Если у вас возникли вопросы, не стесняйтесь публиковать их в разделе "Вопросы" на сайтеUltralytics или в разделе обсуждений, указанном ниже.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Как начать использовать отображение объектов VisionEye с Ultralytics YOLO11 ?

Чтобы начать использовать VisionEye Object Mapping с Ultralytics YOLO11 , сначала вам нужно установить пакет Ultralytics YOLO с помощью pip. Затем вы можете использовать код примера, приведенный в документации, чтобы настроить обнаружение объектов с помощью VisionEye. Вот простой пример для начала работы:

import cv2

from ultralytics import YOLO

model = YOLO("yolo11n.pt")
cap = cv2.VideoCapture("path/to/video/file.mp4")

while True:
    ret, frame = cap.read()
    if not ret:
        break

    results = model.predict(frame)
    for result in results:
        # Perform custom logic with result
        pass

    cv2.imshow("visioneye", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Каковы ключевые особенности функции отслеживания объектов VisionEye с помощью Ultralytics YOLO11 ?

Функция отслеживания объектов VisionEye с Ultralytics YOLO11 позволяет пользователям следить за перемещением объектов в кадре видео. Ключевые особенности включают:

Отслеживание объектов в режиме реального времени: Следит за перемещением объектов.
Идентификация объектов: Используются мощные алгоритмы обнаружения YOLO11.
Вычисление расстояний: Вычисляет расстояния между объектами и указанными точками.
Аннотация и визуализация: Обеспечивает визуальные маркеры для отслеживаемых объектов.

Вот краткий фрагмент кода, демонстрирующий отслеживание с помощью VisionEye:

import cv2

from ultralytics import YOLO

model = YOLO("yolo11n.pt")
cap = cv2.VideoCapture("path/to/video/file.mp4")

while True:
    ret, frame = cap.read()
    if not ret:
        break

    results = model.track(frame, persist=True)
    for result in results:
        # Annotate and visualize tracking
        pass

    cv2.imshow("visioneye-tracking", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Для получения исчерпывающего руководства посетите раздел VisionEye Object Mapping with Object Tracking.

Как рассчитать расстояние с помощью модели VisionEye YOLO11 ?

Расчет расстояния с помощью VisionEye и Ultralytics YOLO11 включает в себя определение расстояния обнаруженных объектов от заданной точки в кадре. Это расширяет возможности пространственного анализа, полезного в таких приложениях, как автономное вождение и наблюдение.

Вот упрощенный пример:

import math

import cv2

from ultralytics import YOLO

model = YOLO("yolo11n.pt")
cap = cv2.VideoCapture("path/to/video/file.mp4")
center_point = (0, 480)  # Example center point
pixel_per_meter = 10

while True:
    ret, frame = cap.read()
    if not ret:
        break

    results = model.track(frame, persist=True)
    for result in results:
        # Calculate distance logic
        distances = [
            (math.sqrt((box[0] - center_point[0]) ** 2 + (box[1] - center_point[1]) ** 2)) / pixel_per_meter
            for box in results
        ]

    cv2.imshow("visioneye-distance", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Подробные инструкции см. в разделе " VisionEye с расчетом расстояния".

Почему стоит использовать Ultralytics YOLO11 для отображения и отслеживания объектов?

Ultralytics YOLO11 славится своей скоростью, точностью и простотой интеграции, что делает его лучшим выбором для картографирования и отслеживания объектов. Ключевые преимущества включают:

Современная производительность: Обеспечивает высокую точность обнаружения объектов в режиме реального времени.
Гибкость: Поддерживает различные задачи, такие как обнаружение, отслеживание и расчет расстояния.
Сообщество и поддержка: Обширная документация и активное сообщество GitHub для поиска и устранения неисправностей и улучшений.
Простота использования: интуитивно понятный API упрощает сложные задачи, позволяя быстро развертывать и итерации.

Более подробную информацию о приложениях и льготах можно найти на сайте Ultralytics YOLO11 .

Как интегрировать VisionEye с другими инструментами машинного обучения, например Comet или ClearML?

Ultralytics YOLO11 может легко интегрироваться с различными инструментами машинного обучения, такими как Comet и ClearML, улучшая отслеживание экспериментов, сотрудничество и воспроизводимость. Чтобы начать работу, следуйте подробным руководствам по использованию YOLOv5 с Comet и интеграции YOLO11 с ClearML.

Более подробную информацию и примеры интеграции можно найти в нашем руководстве по интеграцииUltralytics .

📅 Создано 11 месяцев назад ✏️ Обновлено 2 месяца назад