Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 против YOLOX#

За последние несколько лет область компьютерного зрения стремительно развилась, а модели обнаружения объектов в реальном времени стали значительно сложнее. Выбирая архитектуру для производственной среды или академических исследований, разработчики часто взвешивают компромиссы между наследием прошлых этапов и передовыми инновациями. В этом подробном сравнении исследуются различия между Ultralytics YOLO11 и YOLOX от Megvii, что дает глубокое представление об их архитектурах, метриках производительности и идеальных сценариях развертывания.

Link to this sectionОбзор архитектуры#

Обе модели представляют собой значительные шаги вперед в области обнаружения объектов, но они основаны на разных философиях проектирования и ориентированы на различный опыт разработчиков.

Link to this sectionYOLO11: Универсальный многозадачный движок#

Выпущенная в сентябре 2024 года Гленном Джочером и Цзин Цю в Ultralytics, YOLO11 создана как единая платформа, сочетающая высокую точность с экстремальной эффективностью.

YOLO11 выходит за рамки стандартных ограничивающих рамок, нативно поддерживая сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение с помощью ориентированных ограничивающих рамок (OBB). Ее улучшенная архитектура оптимизирует извлечение признаков, обеспечивая лучшее сохранение характеристик в сложных пространственных иерархиях.

Узнай больше о YOLO11

Link to this sectionYOLOX: Пионер без использования анкоров#

Разработанная исследователями из Megvii, YOLOX привлекла значительное внимание в 2021 году, преодолев разрыв между исследованиями и промышленным применением благодаря подходу, полностью не использующему анкоры (anchor-free).

YOLOX представила развязанную «голову» (decoupled head) и парадигму без анкоров, что значительно сократило количество параметров проектирования и улучшило производительность на академических тестах на момент выпуска.

Узнать больше о YOLOX

Знаешь ли ты?

Дизайн без использования анкоров, популяризированный YOLOX, вдохновил многие последующие архитектуры. Ultralytics внедрила и значительно доработала эти концепции в более поздних итерациях, таких как YOLOv8 и YOLO11, чтобы обеспечить превосходную точность и гибкость развертывания.

Link to this sectionПроизводительность и метрики#

При оценке моделей обнаружения критически важно изучить баланс параметров, вычислительных затрат (FLOPs) и среднего значения точности (mAP) для реального развертывания моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Как видно из таблицы, YOLO11x значительно превосходит YOLOXx по абсолютной точности (54.7 mAP против 51.1 mAP), требуя при этом примерно вдвое меньше параметров (56.9M против 99.1M). Эта эффективность означает меньшие требования к памяти как во время обучения, так и при выводе, что является огромным преимуществом для производственных сред.

Link to this sectionЭкосистема и опыт разработчика#

Link to this sectionПреимущество Ultralytics#

Одно из самых глубоких различий между YOLO11 и YOLOX заключается в удобстве использования. YOLOX работает в основном как исследовательская кодовая база, требующая сложной настройки окружения, ручной компиляции операторов C++ и громоздких аргументов командной строки для запуска обучения на пользовательских наборах данных.

В резком контрасте, YOLO11 полностью интегрирована в пакет Ultralytics Python, обеспечивая оптимизированный рабочий процесс «от нуля до героя». Платформа Ultralytics предлагает широкие инструменты для разметки данных, отслеживания экспериментов и облачного обучения, абстрагируясь от шаблонного кода, чтобы инженеры могли сосредоточиться на производительности модели.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Более того, экспорт модели Ultralytics в форматы, такие как TensorRT, CoreML или OpenVINO, требует всего одной команды, тогда как старые репозитории часто требуют сложных сторонних инструментов или ручного вмешательства в граф.

Link to this sectionРеальные сценарии использования#

Link to this sectionКогда стоит рассмотреть YOLOX#

YOLOX остается подходящим вариантом для специализированных, устаревших развертываний, где разработчики уже создали сильно кастомизированные конвейеры вывода на C++ вокруг конкретных тензорных выходов ее развязанной «головы». Кроме того, исследователи, проводящие сравнительные анализы с архитектурами уровня 2021 года, по-прежнему будут использовать YOLOX в качестве эталона для набора данных для бенчмаркинга.

Link to this sectionВ чем YOLO11 превосходит других#

Почти для всех современных производственных сценариев YOLO11 предоставляет гораздо лучший опыт:

  • Умные города и розничная торговля: Благодаря исключительному соотношению скорости и точности, YOLO11 без усилий справляется с переполненными сценами, обеспечивая работу автоматизированной розничной аналитики и систем управления трафиком без необходимости в массивных GPU-кластерах.
  • Edge Computing: The high memory efficiency and robust export options make YOLO11 perfect for edge AI deployments on devices like Raspberry Pi or NVIDIA Jetson platforms.
  • Сложные конвейеры: Если проект требует сочетания обнаружения объектов с ключевыми точками позы (например, спортивная аналитика) или точной сегментацией экземпляров (например, медицинская визуализация), YOLO11 выполняет все эти задачи нативно через один унифицированный API.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLO11 и YOLOX зависит от твоих конкретных требований к проекту, ограничений при развертывании и предпочтений в экосистеме.

Link to this sectionКогда выбирать YOLO11#

YOLO11 — отличный выбор для:

  • Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
  • Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
  • Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.

Link to this sectionКогда выбирать YOLOX#

YOLOX рекомендуется для:

  • Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
  • Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
  • Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionВзгляд в будущее: мощь YOLO26#

Хотя YOLO11 является исключительным выбором, ландшафт AI постоянно ускоряется. Для команд, ищущих абсолютную вершину эффективности и стабильности, YOLO26 (выпущенная в январе 2026 года) является главной рекомендацией для новых проектов в области компьютерного зрения.

YOLO26 представляет собой огромный шаг вперед за счет внедрения дизайна без NMS (End-to-End). Устраняя постобработку немаксимального подавления (NMS), она полностью удаляет вариативность задержки, значительно упрощая логику развертывания — концепция, впервые внедренная в YOLOv10.

Более того, YOLO26 обладает функцией удаления DFL (Distribution Focal Loss), оптимизируя архитектуру для достижения до 43% более быстрого вывода на CPU, что делает ее неоспоримым чемпионом для маломощных и периферийных устройств. Стабильность обучения также улучшена с помощью оптимизатора MuSGD — гибрида SGD и Muon, вдохновленного LLM, который ускоряет сходимость. В сочетании с передовыми функциями потерь, такими как ProgLoss + STAL, YOLO26 превосходно обнаруживает мелкие объекты в сложных условиях, например, на изображениях с дронов и датчиках IoT на периферии.

Дальнейшее изучение

Хочешь расширить свои знания об архитектурах обнаружения объектов? Изучи возможности открытого словаря YOLO-World или погрузись в модель RT-DETR на базе трансформеров, задокументированную в экосистеме Ultralytics.

В заключение, хотя YOLOX внедрила важные архитектурные концепции в 2021 году, комплексный набор инструментов, эффективность памяти и передовая производительность YOLO11 — и особенно революционная архитектура YOLO26 — делают экосистему Ultralytics очевидным выбором для современных исследователей и корпоративных разработчиков.

Контрибьюторы

Комментарии