YOLOX против YOLOv8: глубокий технический анализ эволюции object detection

Ландшафт компьютерного зрения быстро меняется, и новые архитектуры постоянно расширяют границы скорости и точности. Двумя важными вехами на этом пути являются YOLOX и YOLOv8. В этом сравнении исследуются технические нюансы между инновацией YOLOX без привязки к якорям и современной универсальностью Ultralytics YOLOv8. Мы анализируем их архитектуры, показатели производительности и пригодность для реальных приложений, чтобы помочь вам выбрать правильный инструмент для ваших проектов в области машинного обучения.

Переход на новейшие технологии

В то время как YOLOv8 является мощной моделью, эта область продвинулась еще дальше. Ознакомьтесь с YOLO11, последней итерацией от Ultralytics, которая предлагает еще более высокую эффективность, более быструю обработку и повышенную точность для задач обнаружения, сегментации и оценки позы.

Метрики производительности и тесты

При оценке моделей обнаружения объектов решающее значение имеет компромисс между скоростью вывода и средней точностью (mAP). В таблице ниже показано, что Ultralytics YOLOv8 стабильно достигает более высокой точности с меньшей задержкой при сопоставимых размерах моделей.

Примечательно, что YOLOv8 предоставляет прозрачные тесты для вывода на CPU через ONNX, что является важным показателем для развертывания на оборудовании без выделенных GPU. В отличие от этого, стандартные тесты YOLOX в основном ориентированы на производительность GPU, оставляя пробел для пользователей, ориентированных на приложения edge AI на стандартных процессорах.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(M)	FLOPs ^(B)
YOLOXnano	416	25.8	-	-	0.91	1.08
YOLOXtiny	416	32.8	-	-	5.06	6.45
YOLOXs	640	40.5	-	2.56	9.0	26.8
YOLOXm	640	46.9	-	5.43	25.3	73.8
YOLOXl	640	49.7	-	9.04	54.2	155.6
YOLOXx	640	51.1	-	16.1	99.1	281.9

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOX: пионер Anchor-Free

Выпущенный в 2021 году исследователями Megvii, YOLOX внес значительные изменения в семейство YOLO , приняв безъякорный механизм. Такой выбор конструкции устранил необходимость в предопределенных якорных ящиках, упростив процесс обучения и улучшив характеристики в конкретных сценариях.

Авторы: Чжэн Ге, Сунтао Лю, Фэн Ван, Цзэмин Ли и Цзянь Сунь
Организация:Megvii
Дата: 18.07.2021
Arxiv:https://arxiv.org/abs/2107.08430
GitHub:https://github.com/Megvii-BaseDetection/YOLOX

Архитектура и сильные стороны

YOLOX интегрирует decoupled head, разделяя задачи классификации и локализации для повышения скорости сходимости и точности. Он использует SimOTA (Simplified Optimal Transport Assignment) для динамического назначения меток, который рассматривает процесс обучения как задачу оптимальной транспортировки. Будучи революционным в свое время, YOLOX является прежде всего моделью object detection, не имеющей встроенной поддержки других задач, таких как segment или оценка позы в рамках одной кодовой базы.

Узнайте больше о YOLOX

YOLOv8: современный стандарт для Vision AI

YOLOv8, запущенный Ultralytics в начале 2023 года, представляет собой кульминацию обширных исследований в области эффективности, точности и удобства использования. Он опирается на наследие anchor-free, но совершенствует его с помощью современного Task-Aligned Assigner и модернизированной архитектуры, которая превосходно работает на широком спектре оборудования.

Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
Организация:Ultralytics
Дата: 10.01.2023
Документация:https://docs.ultralytics.com/models/yolov8/

Основные преимущества

YOLOv8 — это не просто модель обнаружения; это унифицированный фреймворк. Он предлагает встроенную поддержку классификации изображений, сегментации экземпляров, оценки позы и обнаружения ориентированных объектов (OBB). Эта универсальность позволяет разработчикам решать сложные мультимодальные задачи, используя единый, согласованный API.

Узнайте больше о YOLOv8

Архитектурное сравнение и варианты использования

Понимание технических различий между этими архитектурами помогает в выборе подходящего инструмента для вывода в реальном времени и производственных систем.

1. Эффективность обучения и память

Одной из выдающихся особенностей моделей Ultralytics YOLO является их эффективность обучения. YOLOv8 реализует передовые стратегии увеличения, такие как mosaic и MixUp, оптимизированные для предотвращения переобучения при сохранении высокой скорости обучения.

Ключевым моментом является то, что YOLOv8 демонстрирует более низкие требования к памяти как во время обучения, так и во время инференса по сравнению со старыми архитектурами или тяжелыми моделями на основе трансформеров. Эта эффективность позволяет обучать пользовательские модели на GPU потребительского класса или развертывать их на периферийных устройствах с ограниченным объемом памяти. YOLOX, хотя и эффективен, часто требует больше ручной настройки гиперпараметров для достижения оптимальной стабильности.

2. Экосистема и простота использования

Для разработчиков и исследователей экосистема, окружающая модель, так же важна, как и сама архитектура.

YOLOX follows a traditional research repository structure. Setting it up often involves complex configuration files and manual dependency management.
Ultralytics YOLOv8 уделяет первостепенное внимание простоте использования. Он включает в себя устанавливаемый через pip пакет, оптимизированный Python API и CLI, который работает прямо из коробки.

Простота использования с Ultralytics API

Запуск прогнозов с YOLOv8 невероятно прост и требует всего нескольких строк кода.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

3. Хорошо поддерживаемая экосистема

Выбор YOLOv8 означает получение доступа к хорошо поддерживаемой экосистеме. Ultralytics предоставляет исчерпывающую документацию, частые обновления и активную поддержку сообщества. Интеграция с более широкой экосистемой Ultralytics упрощает рабочие процессы, включая аннотацию данных, управление наборами данных и развертывание моделей в таких форматах, как TensorRT и OpenVINO.

Приложения в реальном мире

Где превосходит YOLOv8

Интеллектуальная розничная торговля: Использование возможностей сегментации для понимания планировки полок и размещения продуктов с точностью до пикселя.
Спортивная аналитика: Использование оценки позы для отслеживания движений игроков и биомеханики в реальном времени — задача, которую YOLOX не может выполнять изначально.
Промышленный контроль: Развертывание obb моделей для detect вращающихся объектов, таких как компоненты на конвейерной ленте, с высокой точностью.
Развертывание на периферии: Превосходное соотношение скорости и точности YOLOv8 делает его предпочтительным выбором для мобильных приложений и встроенных систем, таких как Raspberry Pi или NVIDIA Jetson.

Ниша YOLOX

YOLOX остается сильным кандидатом для академических исследований, посвященных конкретно теоретическим аспектам anchor-free detection heads. Его кодовая база предоставляет четкую ссылку для исследователей, изучающих переход от anchor-based к anchor-free методологиям в эпоху 2021 года.

Заключение

В то время как YOLOX сыграла ключевую роль в популяризации detectирования без anchor, Ultralytics YOLOv8 представляет собой естественную эволюцию этой технологии. Предлагая превосходные показатели производительности, универсальный фреймворк для многозадачного обучения и непревзойденный пользовательский опыт, YOLOv8 выделяется как превосходный выбор для современной разработки AI.

Для разработчиков, ищущих надежное, перспективное решение, которое масштабируется от быстрого прототипирования до корпоративного развертывания, Ultralytics YOLOv8 — и более новый YOLO11 — предоставляет необходимые инструменты для достижения успеха.

Изучите другие модели

Расширьте свое понимание ландшафта detect объектов, изучив эти сравнения:

YOLOv8 vs. YOLOv5
YOLOv8 и YOLOv7
YOLOv8 vs. RT-DETR
YOLOv8 и YOLOv10
YOLOX против YOLOv7
Откройте для себя возможности YOLO11 для новейших достижений.