Безопасные для потоков выводы с помощью моделей YOLO

Q: Is it safer to use process-based parallelism instead of threading for YOLO model inference?

Да, использование модуля Python'multiprocessing' безопаснее и зачастую эффективнее для параллельного выполнения вывода моделей YOLO . Параллелизм на основе процессов создает отдельные пространства памяти, что позволяет избежать глобальной блокировки интерпретатора (GIL) и снизить риск возникновения проблем с параллелизмом. Каждый процесс будет работать независимо со своим экземпляром модели YOLO . Подробнее о параллелизме на основе процессов при работе с моделями YOLO читай на странице "Thread-Safe Inference".

Запуск моделей YOLO в многопоточной среде требует тщательного подхода для обеспечения безопасности потоков. Python's threading Модуль позволяет тебе запускать несколько потоков одновременно, но когда дело доходит до использования моделей YOLO в этих потоках, возникают важные вопросы безопасности, о которых нужно знать. На этой странице ты узнаешь, как создать безопасный для потоков вывод моделей YOLO.

Понимание Python Threading

Потоки в Python - это форма параллелизма, которая позволяет твоей программе выполнять несколько операций одновременно. Однако глобальная блокировка интерпретатора (GIL) в Python означает, что только один поток может одновременно выполнять байткод Python.

Примеры однопоточной и многопоточной работы

Хотя это звучит как ограничение, потоки все же могут обеспечить параллелизм, особенно при операциях, связанных с вводом-выводом, или при использовании операций, освобождающих GIL, например, тех, которые выполняются библиотеками YOLO, лежащими в основе языка C.

Опасность общих экземпляров моделей

Инстанцирование модели YOLO вне твоих потоков и совместное использование этого экземпляра несколькими потоками может привести к возникновению условий гонки, когда внутреннее состояние модели непоследовательно изменяется из-за одновременного доступа к ней. Это особенно проблематично, когда модель или ее компоненты хранят состояние, которое не рассчитано на потокобезопасность.

Пример без потоковой безопасности: Одиночный экземпляр модели

При использовании потоков в Python важно распознавать шаблоны, которые могут привести к проблемам с параллелизмом. Вот чего тебе следует избегать: совместного использования одного экземпляра модели YOLO в нескольких потоках.

# Unsafe: Sharing a single model instance across threads
from threading import Thread

from ultralytics import YOLO

# Instantiate the model outside the thread
shared_model = YOLO("yolo11n.pt")


def predict(image_path):
    """Predicts objects in an image using a preloaded YOLO model, take path string to image as argument."""
    results = shared_model.predict(image_path)
    # Process results


# Starting threads that share the same model instance
Thread(target=predict, args=("image1.jpg",)).start()
Thread(target=predict, args=("image2.jpg",)).start()

В приведенном выше примере shared_model используется несколькими потоками, что может привести к непредсказуемым результатам, потому что predict может выполняться одновременно несколькими потоками.

Непотокобезопасный пример: Несколько экземпляров модели

Аналогично, здесь представлен небезопасный паттерн с несколькими экземплярами модели YOLO:

# Unsafe: Sharing multiple model instances across threads can still lead to issues
from threading import Thread

from ultralytics import YOLO

# Instantiate multiple models outside the thread
shared_model_1 = YOLO("yolo11n_1.pt")
shared_model_2 = YOLO("yolo11n_2.pt")


def predict(model, image_path):
    """Runs prediction on an image using a specified YOLO model, returning the results."""
    results = model.predict(image_path)
    # Process results


# Starting threads with individual model instances
Thread(target=predict, args=(shared_model_1, "image1.jpg")).start()
Thread(target=predict, args=(shared_model_2, "image2.jpg")).start()

Даже если есть два отдельных экземпляра модели, риск возникновения проблем с параллелизмом все равно существует. Если внутренняя реализация YOLO не является потокобезопасным, использование отдельных экземпляров может не предотвратить возникновения условий гонки, особенно если эти экземпляры имеют общие ресурсы или состояния, которые не являются потокобезопасными.

Безопасное для потоков умозаключение

Чтобы выполнить потокобезопасный вывод, тебе следует инстанцировать отдельную модель YOLO в каждом потоке. Это гарантирует, что у каждого потока будет свой изолированный экземпляр модели, что исключит риск возникновения условий гонки.

Пример безопасного использования нитей

Вот как инстанцировать модель YOLO внутри каждого потока для безопасного параллельного вывода:

# Safe: Instantiating a single model inside each thread
from threading import Thread

from ultralytics import YOLO


def thread_safe_predict(image_path):
    """Predict on an image using a new YOLO model instance in a thread-safe manner; takes image path as input."""
    local_model = YOLO("yolo11n.pt")
    results = local_model.predict(image_path)
    # Process results


# Starting threads that each have their own model instance
Thread(target=thread_safe_predict, args=("image1.jpg",)).start()
Thread(target=thread_safe_predict, args=("image2.jpg",)).start()

В этом примере каждый поток создает свой собственный YOLO instance. Это не позволяет ни одному потоку вмешиваться в состояние модели другого, тем самым гарантируя, что каждый поток выполняет выводы безопасно и без неожиданных взаимодействий с другими потоками.

Заключение

При использовании моделей YOLO с Python'ом threadingЧтобы обеспечить безопасность потоков, всегда инстанцируй свои модели в потоке, который будет их использовать. Такая практика позволяет избежать условий гонки и гарантирует, что твои задачи по выводу будут выполняться надежно.

Для более продвинутых сценариев и дальнейшей оптимизации производительности многопоточных выводов рассмотри возможность использования параллелизма на основе процессов с multiprocessing или использовать очередь задач с выделенными рабочими процессами.

ВОПРОСЫ И ОТВЕТЫ

Как избежать условий гонки при использовании моделей YOLO в многопоточной среде Python ?

Чтобы предотвратить условия гонки при использовании Ultralytics YOLO моделей в многопоточной Python среде, инстанцируй отдельную YOLO модель в каждом потоке. Это гарантирует, что у каждого потока будет свой изолированный экземпляр модели, что позволит избежать одновременной модификации состояния модели.

Пример:

from threading import Thread

from ultralytics import YOLO


def thread_safe_predict(image_path):
    """Predict on an image in a thread-safe manner."""
    local_model = YOLO("yolo11n.pt")
    results = local_model.predict(image_path)
    # Process results


Thread(target=thread_safe_predict, args=("image1.jpg",)).start()
Thread(target=thread_safe_predict, args=("image2.jpg",)).start()

Подробнее об обеспечении безопасности потоков читай в статье Thread-Safe Inference with YOLO Models.

Каковы лучшие практики для выполнения многопоточного YOLO вывода моделей в Python?

Чтобы безопасно выполнять многопоточный YOLO вывод моделей в Python, следуй этим лучшим практикам:

Инстанцируй модели YOLO внутри каждого потока, а не разделяй один экземпляр модели между потоками.
Используй Python's multiprocessing модуль для параллельной обработки, чтобы избежать проблем, связанных с глобальной блокировкой интерпретатора (GIL).
Освободи GIL с помощью операций, выполняемых YOLO'базовыми библиотеками C.

Пример потокобезопасного инстанцирования модели:

from threading import Thread

from ultralytics import YOLO


def thread_safe_predict(image_path):
    """Runs inference in a thread-safe manner with a new YOLO model instance."""
    model = YOLO("yolo11n.pt")
    results = model.predict(image_path)
    # Process results


# Initiate multiple threads
Thread(target=thread_safe_predict, args=("image1.jpg",)).start()
Thread(target=thread_safe_predict, args=("image2.jpg",)).start()

За дополнительным контекстом обратись к разделу о Thread-Safe Inference.

Почему у каждого потока должен быть свой экземпляр модели YOLO ?

У каждого потока должен быть свой экземпляр модели YOLO , чтобы предотвратить условия гонки. Когда один экземпляр модели используется совместно несколькими потоками, одновременный доступ к нему может привести к непредсказуемому поведению и модификации внутреннего состояния модели. Используя отдельные экземпляры, ты обеспечиваешь изоляцию потоков, что делает твои многопоточные задачи надежными и безопасными.

За подробным руководством обращайся к разделам Non-Thread-Safe Example: Разделы " Одиночный экземпляр модели " и " Пример с сохранением нитей ".

Как Python'Global Interpreter Lock (GIL) влияет на вывод модели YOLO ?

PythonГлобальная блокировка интерпретатора (GIL) позволяет только одному потоку одновременно выполнять байткод Python , что может ограничить производительность многопоточных задач, связанных с CPU. Однако для операций ввода-вывода или процессов, использующих библиотеки, освобождающие GIL, например YOLO'C-библиотеки, ты все равно сможешь добиться параллелизма. Для повышения производительности рассмотри возможность использования параллелизма на основе процессов с помощью Python's multiprocessing Модуль.

Подробнее о резьбе в Python читай в разделе " Понимание резьбы Python ".

Безопаснее ли использовать параллелизм на основе процессов вместо потоков для вывода моделей YOLO ?

Да, используя Python's multiprocessing Модуль является более безопасным и зачастую более эффективным для параллельного выполнения вывода моделей YOLO . Параллелизм на основе процессов создает отдельные пространства памяти, что позволяет избежать глобальной блокировки интерпретатора (GIL) и снизить риск возникновения проблем с параллелизмом. Каждый процесс будет работать независимо со своим экземпляром модели YOLO .

Подробнее о параллелизме на основе процессов в моделях YOLO читай на странице Thread-Safe Inference.

📅 Created 11 months ago ✏️ Updated 23 days ago