Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX против YOLOv8#

Область компьютерного зрения за последние несколько лет стала свидетелем значительных успехов в области детектирования объектов в реальном времени. Поскольку исследователи и инженеры постоянно расширяют границы точности и скорости, ориентироваться в ландшафте доступных моделей бывает непросто. Это подробное руководство содержит детальное техническое сравнение двух весьма влиятельных архитектур: YOLOX и Ultralytics YOLOv8.

Анализируя их уникальные архитектуры, методологии обучения и возможности развертывания, разработчики могут принимать обоснованные решения при выборе оптимального фреймворка для своих проектов в области искусственного интеллекта.

Link to this sectionYOLOX: объединяя научные исследования и индустрию#

YOLOX стала ключевой моделью, которая успешно сократила разрыв между академическими исследованиями и промышленным применением. Она вернула акцент на дизайн без использования анкоров (anchor-free), значительно уменьшив количество параметров проектирования и эвристической настройки, требовавшихся для предыдущих детекторов на основе анкоров.

Информация о модели:
Автор: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li и Jian Sun
Организация: Megvii\nДата: 2021-07-18
Arxiv: YOLOX: Exceeding YOLO Series in 2021\nGitHub: Megvii-BaseDetection/YOLOX\nДокументация: YOLOX Documentation

Link to this sectionАрхитектурные особенности#

YOLOX включает в себя несколько ключевых модификаций, которые отличают ее от предшественников. Самая заметная из них — это развязанная «голова» (decoupled head), которая разделяет задачи классификации и регрессии ограничивающих рамок (bounding box) на отдельные пути. Такой архитектурный выбор разрешает внутренний конфликт между пространственным выравниванием, необходимым для регрессии, и инвариантностью к сдвигу, необходимой для классификации, что ведет к более высокой скорости сходимости во время обучения.

Кроме того, YOLOX использует стратегию назначения меток SimOTA. Этот метод динамического назначения формулирует сопоставление объектов ground truth с предсказаниями как задачу оптимальной транспортировки, эффективно сокращая время обучения и повышая mean average precision (mAP). Модель также использует методы сильной аугментации данных, включая MixUp и Mosaic, хотя она примечательным образом отключает их в течение последних эпох для стабилизации изученных признаков.

Узнай больше о YOLOX

Link to this sectionYOLOv8: Универсальный отраслевой стандарт#

Основанная на многолетних непрерывных исследованиях, Ultralytics YOLOv8 представляет собой значительную эволюцию в современных моделях компьютерного зрения. Она была разработана с нуля как не просто детектор объектов, а как комплексный многозадачный фреймворк, способный решать широкий спектр задач визуального распознавания с невероятно доступным API.

Информация о модели:
Автор: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics\nДата: 2023-01-10
GitHub: ultralytics/ultralytics\nДокументация: YOLOv8 Documentation

Link to this sectionАрхитектурные усовершенствования#

YOLOv8 представляет собой оптимизированную архитектуру, которая заменяет модуль C3 на более эффективный модуль C2f, улучшая поток градиентов и извлечение признаков без значительного увеличения количества параметров. Как и YOLOX, YOLOv8 использует дизайн без анкоров и развязанную «голову»; однако она уточняет расчет функции потерь за счет включения Distribution Focal Loss (DFL) и CIoU loss, что приводит к гораздо более точным предсказаниям ограничивающих рамок, особенно для мелких или перекрывающихся объектов.

Экосистема Ultralytics

Одной из величайших сильных сторон YOLOv8 является ее глубокая интеграция в экосистему Ultralytics. Независимо от того, используешь ли ты унифицированный Python API или визуальный интерфейс Ultralytics Platform, переход от обучения к развертыванию происходит бесшовно, с нативной поддержкой форматов от ONNX до TensorRT.

Помимо стандартного object detection, YOLOv8 нативно поддерживает instance segmentation, image classification, pose estimation и oriented bounding boxes (OBB). Эта многозадачная универсальность делает ее чрезвычайно привлекательным выбором для сложных производственных сред, где необходимо поддерживать несколько типов моделей.

Узнай больше о YOLOv8

Link to this sectionСравнение производительности и метрик#

Сравнивая эти модели, разработчики должны учитывать компромиссы между точностью, задержкой логического вывода и вычислительными затратами. В таблице ниже приведены бенчмарки для обоих семейств моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOv8 стабильно демонстрирует превосходный mAP при сопоставимых размерах параметров, сохраняя при этом отличную скорость работы на GPU. Кроме того, модели Ultralytics известны меньшими требованиями к памяти во время обучения. Это критически важное преимущество при масштабировании размеров пакетов (batch sizes) на потребительском оборудовании, особенно в сравнении с тяжелыми трансформерными архитектурами, такими как RT-DETR, которые потребляют значительно больше памяти CUDA.

Link to this sectionОпыт разработки и развертывания#

Работа с унаследованными (legacy) исследовательскими кодовыми базами часто требует настройки сложных сред и написания пользовательского шаблонного кода для вывода (inference). Напротив, API Ultralytics упрощает это до нескольких строк на Python.

from ultralytics import YOLO

# Initialize the YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Execute inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Этот унифицированный интерфейс является отличительной чертой хорошо поддерживаемой экосистемы Ultralytics, гарантируя, что разработчики тратят меньше времени на отладку проблем окружения и больше времени на итерацию своих computer vision solutions.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOX и YOLOv8 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в отношении экосистемы.

Link to this sectionКогда выбирать YOLOX#

YOLOX — сильный выбор для:

  • Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
  • Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
  • Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Link to this sectionКогда выбирать YOLOv8#

YOLOv8 рекомендуется для:

  • Универсального развертывания с несколькими задачами: проектов, требующих проверенной модели для обнаружения, сегментации, классификации и оценки позы в рамках экосистемы Ultralytics.
  • Устоявшихся производственных систем: существующих производственных сред, уже построенных на архитектуре YOLOv8 со стабильными и хорошо протестированными пайплайнами развертывания.
  • Широкой поддержки сообщества и экосистемы: приложений, которым нужны обширные руководства по YOLOv8, сторонние интеграции и активные ресурсы сообщества.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionВзгляд в будущее: Архитектура YOLO26#

Хотя YOLOv8 обеспечивает исключительный баланс и удобство использования, границы искусственного интеллекта продолжают стремительно расширяться. Выпущенная в январе 2026 года, YOLO26 представляет собой окончательный стандарт для современного развертывания на граничных устройствах (edge) и в облаке, берет фундаментальные концепции предыдущих поколений и неустанно оптимизирует их.

YOLO26 представляет end-to-end дизайн без NMS, полностью исключающий эвристический этап постобработки подавления немаксимумов (non-maximum suppression). Этот прорыв обеспечивает стабильную, детерминированную задержку на различных целях развертывания. Более того, за счет преднамеренного удаления модуля Distribution Focal Loss (DFL), YOLO26 достигает до 43% более быстрого вывода на CPU, что делает ее абсолютно лучшим выбором для встраиваемых систем и мобильных приложений.

Стабильность обучения в YOLO26 также совершила революцию благодаря интеграции нового оптимизатора MuSGD — гибрида SGD и Muon, который ускоряет сходимость. В сочетании с новыми функциями потерь ProgLoss + STAL, YOLO26 обеспечивает заметные улучшения в распознавании мелких объектов, что критически важно для картографии с дронов и security alarm systems.

Link to this sectionЗаключение и рекомендации#

При оценке старых фреймворков в сравнении с современными решениями траектория ясна. Хотя YOLOX была важным шагом в переходе к методологиям без использования анкоров, отсутствие у нее интегрированной многозадачной экосистемы ограничивает ее полезность в динамичных производственных средах.

Для разработчиков, отдающих приоритет бесшовному опыту, универсальной поддержке задач и сильной поддержке сообщества, YOLOv8 остается очень надежным выбором. Однако для тех, кто стремится максимизировать производительность граничных вычислений, устранить узкие места NMS и достичь максимально возможной точности с помощью последних инноваций в обучении, YOLO26 — это однозначно рекомендуемая модель для любого нового проекта в области компьютерного зрения.

Если тебе интересно изучить другие модели в комплекте Ultralytics, ты также можешь ознакомиться с характеристиками производительности YOLO11 или прочитать о новаторских концепциях без NMS, первоначально протестированных в YOLOv10.

Комментарии