Link to this sectionYOLOX против YOLO11#
Эволюция компьютерного зрения во многом обусловлена стремлением к созданию фреймворков для обнаружения объектов в реальном времени, которые обеспечивают баланс между высокой точностью и скоростью логического вывода. Среди наиболее заметных вех на этом пути — YOLOX и Ultralytics YOLO11. Хотя обе модели внесли значительный вклад в эту область, их архитектуры, принципы проектирования и экосистемы разработчиков существенно различаются.
В этом подробном техническом сравнении рассматриваются архитектуры, метрики производительности, методологии обучения и оптимальные сценарии развертывания, что поможет тебе принять взвешенное решение для твоего следующего проекта в области искусственного интеллекта.
Link to this sectionОбзор YOLOX#
Представленный исследователями Чжэн Гэ, Сунтао Лю, Фэн Ваном, Земином Ли и Цзянь Сунем в Megvii 18 июля 2021 года, YOLOX стал значительным сдвигом в серии YOLO. Он успешно преодолел разрыв между академическими исследованиями и промышленным применением, представив архитектуру без использования якорей (anchor-free).
Более подробную техническую информацию можно найти в оригинальной статье о YOLOX на Arxiv.
Link to this sectionКлючевые архитектурные особенности#
YOLOX отошел от традиционного обнаружения на основе якорей, внедрив разделенную голову (decoupled head) и механизм без использования якорей. Такая конструкция сократила количество проектных параметров и улучшила производительность модели в различных бенчмарках. Кроме того, были представлены передовые стратегии назначения меток, такие как SimOTA, для ускорения процесса обучения и улучшения сходимости.
Хотя YOLOX обеспечивает отличную для своего времени точность, он в основном ориентирован на обнаружение объектов с помощью ограничивающих рамок (BBox) и не имеет встроенной поддержки других сложных задач компьютерного зрения без дополнительной настройки.
Исключив предопределенные якорные рамки (anchor boxes), YOLOX радикально снизил необходимость эвристической настройки для разных наборов данных, став надежной базой для исследований методов без использования якорей.
Link to this sectionОбзор Ultralytics YOLO11#
Выпущенная 27 сентября 2024 года Гленном Джочером и Цзин Цю в Ultralytics, YOLO11 является передовой моделью, которая по-новому определяет универсальность и удобство использования в компьютерном зрении. Основанная на многолетних фундаментальных исследованиях, она представляет собой высококлассное, готовое к промышленному внедрению решение, эффективное для решения множества задач.
Link to this sectionПреимущество Ultralytics#
YOLO11 — это не просто детектор объектов; это унифицированный фреймворк, поддерживающий сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB). Модель обладает высокоэффективной архитектурой, обеспечивающей оптимальный баланс между скоростью, количеством параметров и точностью.
Кроме того, YOLO11 полностью интегрирована в платформу Ultralytics, которая предоставляет оптимизированную экосистему для разметки данных, обучения и развертывания моделей.
Link to this sectionСравнение производительности и метрик#
При сравнении этих моделей баланс производительности становится очевидным. YOLO11 достигает более высокого среднего значения точности (mAP) при значительно меньшем количестве параметров и операций (FLOPs) в большинстве категорий размеров по сравнению со своими аналогами из серии YOLOX.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Как показано, модели YOLO11 стабильно превосходят YOLOX по точности, сохраняя при этом меньший объем параметров. Например, YOLO11m достигает 51.5 mAP всего при 20.1 млн параметров, тогда как YOLOXx достигает аналогичных 51.1 mAP, но требует огромных 99.1 млн параметров. Такая эффективность использования памяти при обучении и логическом выводе делает YOLO11 крайне подходящей для развертывания на периферийных AI-устройствах, позволяя избежать высоких требований к памяти CUDA, типичных для старых или основанных на Transformer моделей, таких как RT-DETR.
Модели Ultralytics требуют значительно меньше памяти GPU при обучении по сравнению с YOLOX и архитектурами на базе Transformer, что позволяет тебе обучать мощные модели на стандартном потребительском оборудовании.
Link to this sectionЭкосистема и простота использования#
Одно из самых заметных различий между двумя фреймворками заключается в опыте разработчика.
YOLOX часто требует клонирования репозиториев, настройки сложных окружений и выполнения громоздких команд в CLI для обучения и экспорта моделей в такие форматы, как ONNX или TensorRT.
В резком контрасте с этим, Ultralytics YOLO11 предлагает невероятно простой Python API и CLI. Библиотека Ultralytics автоматически берет на себя аугментацию данных, настройку гиперпараметров и экспорт.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")Эта поддерживаемая экосистема подкреплена обширной документацией и бесшовной интеграцией с такими инструментами, как Weights & Biases, для отслеживания экспериментов.
Link to this sectionИдеальные варианты использования#
Выбор между этими моделями часто зависит от особенностей среды развертывания.
Link to this sectionКогда стоит использовать YOLOX#
- Устаревшие системы: Если у тебя есть налаженный конвейер, построенный исключительно на базе фреймворка MegEngine или парадигм обнаружения объектов начала 2021 года.
- Академические эталоны: При проведении исследований, требующих прямого сравнения с фундаментальными архитектурами без якорей эпохи 2021 года.
Link to this sectionКогда стоит использовать YOLO11#
- Промышленные развертывания: Для коммерческих приложений в умной розничной торговле или системах охранной сигнализации, где надежный, поддерживаемый код и высокая точность являются обязательными требованиями.
- Многозадачные конвейеры: Когда твоему проекту требуется отслеживать объекты, оценивать позы людей и сегментировать экземпляры с использованием одного унифицированного фреймворка.
- Периферийные устройства с ограниченными ресурсами: Благодаря малому количеству параметров и высокой пропускной способности YOLO11 идеально подходит для развертывания на Raspberry Pi или мобильных узлах через CoreML и NCNN.
Link to this sectionВзгляд в будущее: Преимущество YOLO26#
Хотя YOLO11 представляет собой огромный шаг вперед по сравнению с YOLOX, область компьютерного зрения быстро развивается. Разработчикам, начинающим новые проекты сегодня, мы однозначно рекомендуем Ultralytics YOLO26.
Выпущенная в январе 2026 года, YOLO26 берет архитектурное совершенство YOLO11 и внедряет несколько революционных функций:
- Комплексный дизайн без NMS: YOLO26 исключает пост-обработку подавления немаксимумов (NMS), обеспечивая нативный потоковый логический вывод для более быстрых и простых конвейеров развертывания (концепция, впервые исследованная в YOLOv10).
- До 43% более быстрый логический вывод на CPU: Благодаря удалению функции потерь Distribution Focal Loss (DFL) YOLO26 значительно эффективнее работает на CPU и маломощных периферийных устройствах.
- Оптимизатор MuSGD: Вдохновленный инновациями в обучении больших языковых моделей (LLM) от Moonshot AI, оптимизатор MuSGD обеспечивает высокую стабильность обучения и быструю сходимость.
- Усовершенствованные функции потерь: Используя ProgLoss + STAL, YOLO26 достигает заметных улучшений в распознавании мелких объектов, что критически важно для аэросъемки с дронов и автономной робототехники.
Для подавляющего большинства современных задач компьютерного зрения обновление твоего конвейера для использования YOLO26 обеспечит наилучший баланс скорости, точности и простоты развертывания.