Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 против YOLOX#

Эволюция компьютерного зрения в реальном времени прошла множество этапов, где различные архитектуры расширяли границы скорости и точности. Двумя весьма влиятельными моделями в этой области являются YOLOv5 и YOLOX. Хотя обе модели славятся своей высокой производительностью в задачах обнаружения объектов, они используют принципиально разные архитектурные подходы.

Это руководство представляет собой глубокий технический анализ этих двух моделей, сравнивая их архитектуры, показатели производительности, методологии обучения и идеальные сценарии развертывания, чтобы помочь разработчикам и исследователям выбрать подходящий инструмент для своих проектов в области ИИ для компьютерного зрения.

Link to this sectionОбзор моделей и архитектурные различия#

Link to this sectionUltralytics YOLOv5#

Представленный Ultralytics, YOLOv5 быстро стал отраслевым стандартом благодаря исключительному балансу производительности, простоты использования и эффективности использования памяти. Построенный на базе фреймворка PyTorch, YOLOv5 использует архитектуру на основе анкоров. Он опирается на предопределенные формы ограничивающих рамок (bounding boxes) для прогнозирования местоположения объектов, что делает его крайне эффективным для стандартных задач обнаружения объектов.

Одной из величайших сильных сторон YOLOv5 является его хорошо поддерживаемая экосистема. Она может похвастаться обширной документацией, невероятно простым Python API и нативной интеграцией с платформой Ultralytics. Это позволяет разработчикам плавно переходить от разметки набора данных к обучению и экспорту в форматы, такие как ONNX и TensorRT.

Узнай больше о YOLOv5

Преимущества экосистемы

Модели Ultralytics YOLO обычно требуют значительно меньше памяти GPU во время обучения по сравнению со сложными альтернативами на основе трансформеров. Низкое потребление памяти делает YOLOv5 легкодоступным для исследователей, работающих с оборудованием потребительского уровня.

Link to this sectionMegvii YOLOX#

Разработанный исследователями из Megvii, YOLOX пошел по иному пути, представив в семействе YOLO дизайн без использования анкоров (anchor-free). Отказавшись от анкорных рамок, YOLOX упрощает голову детектора и значительно сокращает количество эвристических параметров, требующих ручной настройки при обучении.

YOLOX также включает в себя разделенную голову (decoupled head) — разделяющую задачи классификации и регрессии на разные ветви сети — и использует стратегию назначения меток SimOTA. Эти инновации сокращают разрыв между академическими исследованиями и промышленными приложениями, делая YOLOX особенно эффективным в средах с очень разным масштабом объектов.

Узнай больше о YOLOX

Link to this sectionПроизводительность и метрики#

При оценке моделей компьютерного зрения критически важен баланс между средней точностью (mAP) и скоростью вывода. Обе модели предлагают ряд размеров (от Nano до Extra-Large), чтобы соответствовать различным аппаратным ограничениям.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Хотя YOLOXx достигает чуть более высокой пиковой точности (51.1 mAP), YOLOv5 предоставляет гораздо более надежный и тщательно протестированный конвейер развертывания на оборудовании CPU и GPU. Скорости TensorRT для YOLOv5 подчеркивают его глубокую оптимизацию для устройств граничных вычислений, что делает его весьма надежным выбором для видеоаналитики в реальном времени.

Link to this sectionМетодики обучения и удобство использования#

Опыт разработчика существенно различается между этими двумя архитектурами.

Link to this sectionПодход YOLOX#

Обучение YOLOX обычно требует клонирования исходного репозитория, управления специфическими зависимостями и выполнения сложных сценариев командной строки. Хотя он поддерживает расширенные функции, такие как обучение со смешанной точностью и многоузловые конфигурации через MegEngine, порог вхождения может быть высоким для разработчиков, которым необходимо быстрое прототипирование.

Link to this sectionПреимущество Ultralytics#

Напротив, Ultralytics отдает приоритет исключительно оптимизированному пользовательскому опыту. С помощью Python-пакета ultralytics разработчики могут загружать, обучать и проверять модель с минимальным количеством шаблонного кода. Ultralytics автоматически обрабатывает сложные аугментации данных, эволюцию гиперпараметров и планирование скорости обучения.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

Более того, универсальность YOLOv5 выходит за рамки стандартного обнаружения объектов, предлагая надежную поддержку классификации изображений и сегментации экземпляров в рамках одного и того же связного API.

Упрощенное развертывание

Когда обучение завершено, экспорт модели YOLOv5 в CoreML, TFLite или OpenVINO так же прост, как запуск model.export(format="onnx"). Это исключает необходимость в сторонних скриптах конвертации, которые обычно требуются для исследовательских репозиториев.

Link to this sectionПрименение в реальных условиях#

Выбор между этими моделями зависит от твоей среды развертывания и технических требований:

  • Розничная торговля и управление запасами: Для приложений, требующих распознавания продуктов в реальном времени на граничных устройствах, таких как NVIDIA Jetson, YOLOv5 подходит исключительно хорошо. Его минимальное потребление памяти и высокая скорость вывода TensorRT позволяют выполнять трекинг с нескольких камер без потери кадров.
  • Академические исследования и пользовательские архитектуры: YOLOX высоко ценится в исследовательском сообществе. Его разделенная голова и отсутствие анкоров делают его отличной базовой моделью для инженеров, желающих экспериментировать с новыми стратегиями назначения меток, или для тех, кто работает с наборами данных, где традиционные анкорные рамки не обеспечивают хорошей обобщающей способности.
  • Сельскохозяйственный ИИ: Для задач точного земледелия, таких как обнаружение фруктов или идентификация сорняков с помощью дронов, простота обучения и развертывания моделей YOLOv5 с использованием платформы Ultralytics позволяет отраслевым экспертам внедрять ИИ-решения без необходимости глубокого опыта в области машинного обучения.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOv5 и YOLOX зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать YOLOv5#

YOLOv5 — отличный выбор для:

  • Проверенных производственных систем: существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
  • Обучения с ограниченными ресурсами: сред с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и более низкие требования к памяти являются преимуществом.
  • Обширной поддержки форматов экспорта: проектов, требующих развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.

Link to this sectionКогда выбирать YOLOX#

YOLOX рекомендуется для:

  • Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
  • Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
  • Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionБудущее ИИ в компьютерном зрении: встречай YOLO26#

Хотя и YOLOv5, и YOLOX закрепили свое место в истории компьютерного зрения, эта область быстро развивается. Для разработчиков, начинающих новые проекты сегодня, Ultralytics настоятельно рекомендует изучить свою новейшую флагманскую модель, YOLO26.

Выпущенная в январе 2026 года, YOLO26 представляет собой огромный скачок вперед как в производительности, так и в удобстве использования. Она представляет революционный дизайн end-to-end без NMS, полностью исключающий постобработку Non-Maximum Suppression. Это значительно снижает вариативность задержки и упрощает логику развертывания на маломощных устройствах.

Более того, YOLO26 использует новый оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM — для невероятно стабильной и быстрой сходимости. Благодаря удалению DFL (Distribution Focal Loss убрана для упрощенного экспорта и лучшей совместимости с граничными/маломощными устройствами), YOLO26 достигает до 43% более быстрого вывода на CPU, закрепляя свою позицию как идеальной модели для современных граничных вычислений, робототехники и приложений IoT. Кроме того, ProgLoss + STAL обеспечивают улучшенные функции потерь с заметными улучшениями в распознавании мелких объектов, что критически важно для IoT, робототехники и аэрофотосъемки. Пользователи, интересующиеся предыдущими поколениями, могут также обратить внимание на YOLO11, хотя YOLO26 является бесспорным современным выбором state-of-the-art.

Link to this sectionЗаключение#

YOLOv5 и YOLOX предлагают невероятные возможности обнаружения объектов. YOLOX расширил архитектурные границы, доказав, что дизайны без анкоров могут конкурировать с традиционными методами и превосходить их в 2021 году. Однако YOLOv5 остается доминирующей силой благодаря своей непревзойденной простоте использования, обширной экосистеме и меньшим требованиям к памяти во время обучения.

Для подавляющего большинства коммерческих приложений экосистема Ultralytics обеспечивает кратчайший путь от сырого набора данных до развернутой производственной модели. Независимо от того, используешь ли ты проверенный временем YOLOv5 или переходишь на передовой YOLO26, ты выигрываешь от использования фреймворка, разработанного для того, чтобы сделать ИИ в области зрения доступным, эффективным и высокопроизводительным.

Контрибьюторы

Комментарии