Link to this sectionYOLOv8 против YOLOX#
Ландшафт компьютерного зрения сильно изменился благодаря постоянному развитию архитектур обнаружения объектов в реальном времени. Двумя важными вехами на этом пути стали Ultralytics YOLOv8 и YOLOX. Хотя обе модели используют парадигму проектирования без анкоров для упрощения прогнозирования ограничивающих рамок (bounding box), они представляют собой разные эпохи и философии в исследованиях глубокого обучения и развитии экосистем для развертывания.
Это всестороннее техническое сравнение исследует их архитектуры, методологии обучения и показатели производительности в реальных условиях, чтобы помочь разработчикам и исследователям выбрать оптимальное решение для своих приложений в области компьютерного зрения.
Link to this sectionИстория моделей#
Понимание происхождения и целей проектирования каждой среды дает важный контекст для их архитектурных различий и зрелости экосистемы.
Link to this sectionUltralytics YOLOv8#
Разработанная Гленном Джочером, Аюшем Чаурасией и Цзин Цю в Ultralytics и выпущенная 10 января 2023 года, модель YOLOv8 ознаменовала значительный скачок в экосистеме Ultralytics. Основываясь на огромном успехе YOLOv5, YOLOv8 представила высокооптимизированную, современную архитектуру, способную нативно решать широкий спектр задач, включая обнаружение объектов, сегментацию экземпляров, классификацию изображений и оценку позы.
Ее главное преимущество заключается в хорошо поддерживаемой экосистеме Ultralytics, которая обеспечивает простой опыт работы «с нуля» благодаря унифицированному Python API, обширной документации и встроенным интеграциям с MLOps-инструментами, такими как Weights & Biases и Comet.
Исследуй YOLOv8 на платформе Ultralytics
Link to this sectionYOLOX#
Представленная Чжэн Гэ, Сунтао Лю, Фэн Ваном, Земингом Ли и Цзянь Сунем из Megvii 18 июля 2021 года, модель YOLOX была нацелена на сокращение разрыва между академическими исследованиями и промышленными приложениями. Подробно описанная в их статье на Arxiv, YOLOX произвела фурор, переведя семейство YOLO на дизайн без анкоров и внедрив разделенную «голову» (decoupled head), что улучшило стабильность обучения и сходимость.
Хотя в 2021 году она оказала огромное влияние, GitHub-репозиторий YOLOX остается преимущественно кодовой базой для исследований. Ей не хватает обширной универсальности задач и отточенных конвейеров развертывания, которые есть в современных фреймворках, поэтому она требует больше ручной настройки для внедрения в производство.
Link to this sectionАрхитектурные инновации#
Обе модели используют подход без анкоров, устраняя необходимость в сложном кластеризации anchor box для конкретных наборов данных перед обучением. Это уменьшает количество эвристических параметров настройки и упрощает «голову» обнаружения.
Link to this sectionРазделенные головы и извлечение признаков#
YOLOX стала пионером в интеграции разделенной головы в серию YOLO. Традиционно задачи классификации и регрессии выполнялись в одной унифицированной голове, что часто приводило к конфликтующим градиентам во время обучения. Разделив ветви классификации и локализации, YOLOX добилась более быстрой сходимости.
YOLOv8 переняла и значительно усовершенствовала эту концепцию. Она использует современный модуль C2f (Cross-Stage Partial Bottleneck с двумя свертками) в своем бэкбоне, заменяя старый модуль C3. Это улучшает поток градиентов и представление признаков без значительного увеличения вычислительных затрат. Кроме того, YOLOv8 реализует продвинутую голову обнаружения без анкоров с использованием Task-Aligned Assigner, динамически подбирая положительные образцы на основе комбинации оценок классификации и Intersection over Union (IoU), что приводит к превосходной точности.
Модели Ultralytics YOLO спроектированы с учетом исключительной эффективности памяти. По сравнению с архитектурами на базе Transformer или неоптимизированными исследовательскими кодовыми базами, YOLOv8 требует значительно меньше памяти CUDA во время обучения, что позволяет тебе использовать большие размеры пакетов (batch sizes) на обычном потребительском оборудовании.
Link to this sectionСравнение производительности#
При оценке моделей для реального развертывания баланс между точностью (mAP) и задержкой вывода (inference latency) вместе со сложностью модели имеет первостепенное значение. В приведенной ниже таблице представлены показатели производительности на датасете COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Как видно, модели YOLOv8 стабильно превосходят свои аналоги YOLOX при одинаковом количестве параметров. Например, YOLOv8m достигает mAP 50,2% по сравнению с 46,9% у YOLOXm, демонстрируя существенный скачок в точности при сохранении конкурентоспособной скорости вывода на GPU с использованием TensorRT.
Link to this sectionПреимущества обучения и экосистемы#
Одно из самых явных различий между этими двумя решениями — это опыт разработчика. Обучение YOLOX часто требует сложной настройки окружения, внесения правок в скрипты вручную и глубоких знаний внутренней работы PyTorch для отладки утечек памяти или проблем с экспортом.
Напротив, экосистема Ultralytics абстрагирует эту сложность, предоставляя интуитивно понятный Python API и интерфейс командной строки (CLI).
Link to this sectionОптимизированный Python API#
Для обучения современной модели YOLOv8 на собственном наборе данных тебе потребуется всего несколько строк кода:
from ultralytics import YOLO
# Load a pre-trained YOLOv8 model for object detection
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Easily validate the model
metrics = model.val()
# Export seamlessly to ONNX for production
model.export(format="onnx")Этот API стандартизирует рабочие процессы для задач обнаружения, сегментации и ориентированных ограничивающих рамок (OBB), значительно сокращая время выхода на рынок для производственных приложений. Кроме того, встроенные функции экспорта позволяют беспрепятственно выполнять конвертацию в ONNX, OpenVINO и CoreML без написания пользовательских операторов C++.
Link to this sectionИдеальные варианты использования#
Выбор между этими архитектурами зависит от ограничений твоего проекта, хотя YOLOv8 предоставляет гораздо более гибкую основу.
- Высокоскоростная периферийная аналитика (Edge Analytics): Для обработки в реальном времени на устройствах вроде NVIDIA Jetson YOLOv8 предлагает непревзойденный баланс скорости и точности, легко развертываемый через нативную интеграцию с TensorRT.
- Академические исследования: YOLOX остается ценным образовательным инструментом для исследователей, изучающих переход от методологий на основе анкоров к методологиям без анкоров в PyTorch.
- Сложные многозадачные приложения: Приложения, требующие одновременного отслеживания объектов и сегментации экземпляров, будут сильно выигрывать от использования YOLOv8, так как эти возможности встроены непосредственно в библиотеку Ultralytics.
Link to this sectionВзгляд в будущее: альтернативные модели#
Хотя YOLOv8 — это огромное улучшение по сравнению с YOLOX, область ИИ развивается невероятно быстро. Пользователям, которые начинают новые проекты, мы настоятельно рекомендуем оценить Ultralytics YOLO26. Выпущенная в январе 2026 года, модель YOLO26 представляет собой новый золотой стандарт для ИИ в компьютерном зрении.
YOLO26 обладает революционным дизайном без NMS (End-to-End), полностью исключающим постобработку Non-Maximum Suppression для более простых конвейеров развертывания. В сочетании с новым оптимизатором MuSGD и удалением Distribution Focal Loss (DFL), YOLO26 обеспечивает увеличение скорости вывода на CPU до 43% по сравнению с YOLOv8. Также в ней представлены функции потерь ProgLoss + STAL, предлагающие значительные улучшения в распознавании мелких объектов, что критически важно для аэрофотосъемки и робототехники.
В качестве альтернативы пользователи могут рассмотреть YOLO11 как еще одного сильного и хорошо поддерживаемого предшественника в экосистеме Ultralytics, предлагающего надежную производительность в разнообразных задачах.
Link to this sectionЗаключение#
YOLOX успешно продемонстрировала мощь разделенных голов и дизайна без анкоров в семействе YOLO. Однако Ultralytics YOLOv8 взяла эти концепции, усовершенствовала архитектуру и обернула ее в готовую к производству экосистему, которая остается непревзойденной по простоте использования и универсальности задач. Выбирая модель Ultralytics, ты получаешь доступ к превосходной производительности, экономичному обучению и надежному набору инструментов для развертывания, которые делают переход от экспериментов к реальным результатам бесшовным.