YOLOX против YOLOv8: техническое погружение в эволюцию обнаружения объектов
Ландшафт компьютерного зрения быстро меняется, а новые архитектуры постоянно расширяют границы скорости и точности. Двумя важными вехами на этом пути стали YOLOX и YOLOv8. В этом сравнении рассматриваются технические нюансы между безъякорной инновацией YOLOX и ультрасовременной универсальностью YOLOv8. Ultralytics YOLOv8. Мы проанализируем их архитектуры, показатели производительности и пригодность для реальных приложений, чтобы помочь вам выбрать правильный инструмент для ваших проектов машинного обучения.
Переход на новейшие технологии
Хотя YOLOv8 является мощной моделью, в этой области произошел дальнейший прогресс. Посмотрите YOLO11последнюю итерацию от Ultralytics, которая обеспечивает еще большую эффективность, скорость обработки и повышенную точность для задач обнаружения, сегментации и оценки позы.
Показатели эффективности и контрольные показатели
При оценке моделей обнаружения объектов очень важен компромисс между скоростью вывода и средней точностью (mAP). В таблице ниже показано, что Ultralytics YOLOv8 постоянно достигает более высокой точности при меньшей задержке при сопоставимых размерах модели.
Примечательно, что YOLOv8 предоставляет прозрачные бенчмарки для выводов CPU через ONNXчто является критически важным показателем для развертывания на оборудовании без выделенных GPU. В отличие от этого, стандартные бенчмарки YOLOX в первую очередь ориентированы на производительность GPU , что оставляет пробел для пользователей, нацеленных на приложения краевого ИИ на стандартных процессорах.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOX: пионер без якоря
Выпущенный в 2021 году исследователями Megvii, YOLOX внес значительные изменения в семейство YOLO , приняв безъякорный механизм. Такой выбор конструкции устранил необходимость в предопределенных якорных ящиках, упростив процесс обучения и улучшив характеристики в конкретных сценариях.
- Авторы: Чжэн Ге, Сунтао Лю, Фэн Ван, Цзэмин Ли и Цзянь Сунь
- Организация:Megvii
- Дата: 18.07.2021
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
Архитектура и сильные стороны
В YOLOX реализована раздельная головка, разделяющая задачи классификации и локализации для повышения скорости и точности сходимости. В ней используется SimOTA (Simplified Optimal Transport Assignment) для динамического назначения меток, которая рассматривает процесс обучения как оптимальную транспортную задачу. Несмотря на то, что в то время YOLOX был революционным, он в первую очередь является моделью обнаружения объектов и не поддерживает другие задачи, такие как сегментация или оценка позы в рамках одной кодовой базы.
YOLOv8: современный стандарт искусственного интеллекта для зрения
YOLOv8 , выпущенная в начале 2023 года компанией Ultralytics, представляет собой кульминацию обширных исследований в области эффективности, точности и удобства использования. Она опирается на безъякорное наследие, но совершенствует его с помощью современного назначающего устройства с выравниванием задач и модернизированной архитектуры, которая отлично работает на широком спектре аппаратных средств.
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация:Ultralytics
- Дата: 10.01.2023
- Документы:https://docs.ultralytics.com/models/yolov8/
Ключевые преимущества
YOLOv8 - это не просто модель обнаружения, это единый фреймворк. Он предлагает встроенную поддержку классификации изображений, сегментации объектов, оценки позы и ориентированного обнаружения объектов (OBB). Такая универсальность позволяет разработчикам решать сложные мультимодальные задачи с помощью единого, целостного API.
Сравнение архитектур и примеры использования
Понимание технических различий между этими архитектурами помогает выбрать подходящий инструмент для систем вывода и производства в реальном времени.
1. Эффективность тренировок и память
Одной из отличительных особенностей моделей Ultralytics YOLO является их эффективность обучения. В YOLOv8 реализованы передовые стратегии дополнения, такие как мозаика и смешение, оптимизированные для предотвращения чрезмерной подгонки при сохранении высокой скорости обучения.
Важно, что YOLOv8 демонстрирует более низкие требования к памяти как при обучении, так и при выводах по сравнению с более старыми архитектурами или моделями на основе тяжелых трансформаторов. Такая эффективность делает возможным обучение пользовательских моделей на графических процессорах потребительского класса или их развертывание на граничных устройствах с ограниченным объемом памяти. YOLOX, несмотря на свою эффективность, часто требует ручной настройки гиперпараметров для достижения оптимальной стабильности.
2. Экосистема и простота использования
Для разработчиков и исследователей экосистема, окружающая модель, так же важна, как и сама архитектура.
- YOLOX придерживается традиционной структуры исследовательского репозитория. Его настройка часто связана со сложными конфигурационными файлами и ручным управлением зависимостями.
- Ultralytics YOLOv8 Приоритетом является простота использования. В нем есть пакет, устанавливаемый с помощью pip, оптимизированный Python API и CLI , который работает из коробки.
Простота использования API Ultralytics
Запуск предсказаний с помощью YOLOv8 невероятно прост и требует всего нескольких строк кода.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
3. Хорошо поддерживаемая экосистема
Выбирая YOLOv8 , вы получаете доступ к хорошо поддерживаемой экосистеме. Ultralytics предоставляет исчерпывающую документацию, частые обновления и активную поддержку сообщества. Интеграция с широкой экосистемойUltralytics упрощает рабочие процессы, включая аннотирование данных, управление наборами данных и развертывание моделей в таких форматах, как TensorRT и OpenVINO.
Приложения в реальном мире
В чем YOLOv8 преуспевает
- Умная розничная торговля: Использование возможностей сегментации для понимания расположения полок и размещения товаров с точностью до пикселя.
- Спортивная аналитика: Использование оценки позы для track движений и биомеханики игрока в режиме реального времени - задача, которую YOLOX не может выполнить нативно.
- Промышленная инспекция: Развертывание моделей OBB для detect вращающихся объектов, таких как компоненты на конвейерной ленте, с высокой точностью.
- Граничное развертывание: Превосходное соотношение скорости и точности YOLOv8 делает его предпочтительным выбором для мобильных приложений и встраиваемых систем, таких как Raspberry Pi или NVIDIA Jetson.
Ниша YOLOX
YOLOX остается сильным кандидатом для академических исследований, сосредоточенных на теоретических аспектах безъякорных головок обнаружения. Его кодовая база представляет собой четкий ориентир для исследователей, изучающих переход от методологий с якорем к методологиям без якоря в эпоху 2021 года.
Заключение
YOLOX сыграл ключевую роль в популяризации безъякорного обнаружения, Ultralytics YOLOv8 представляет собой естественное развитие этой технологии. Предлагая превосходные показатели производительности, универсальную многозадачную структуру обучения и непревзойденный пользовательский опыт, YOLOv8 является лучшим выбором для современной разработки ИИ.
Разработчикам, которые ищут надежное, перспективное решение, масштабируемое от быстрого создания прототипа до развертывания на предприятии, Ultralytics YOLOv8более новая версия YOLO11-предоставляют необходимые инструменты для достижения успеха.
Изучите другие модели
Изучив эти сравнения, вы расширите свое представление об особенностях обнаружения объектов:
- YOLOv8 vs. YOLOv5
- YOLOv8 против YOLOv7
- YOLOv8 vs. RT-DETR
- YOLOv8 против YOLOv10
- YOLOX против YOLOv7
- Откройте для себя возможности YOLO11 и узнайте о последних достижениях.