Перейти к содержанию

YOLO26 против YOLOv5: прогресс в области обнаружения объектов в реальном времени

Эволюция обнаружения объектов отмечена значительными вехами, и сравнение YOLO26 с легендарным YOLOv5 позволяет ясно увидеть, как далеко продвинулось компьютерное зрение. В то время как YOLOv5 отраслевой стандарт удобства использования и сбалансированности в 2020 году, YOLO26 представляет собой передовые достижения в области генеративного ИИ и исследований в области зрения в 2026 году. В этом руководстве подробно анализируются их архитектуры, показатели производительности и идеальные сценарии развертывания, чтобы помочь вам выбрать подходящий инструмент для вашего проекта.

Краткое изложение

YOLOv5, выпущенный компанией Ultralytics в 2020 году, демократизировала ИИ, сделав обнаружение объектов доступным, быстрым и простым в обучении. Он остается надежным рабочим инструментом для устаревших систем.

YOLO26, выпущенный в январе 2026 года, основан на этом наследии и имеет встроенную архитектуру «от конца до конца», которая устраняет немаксимальное подавление (NMS). В нем представлен оптимизатор MuSGD, вдохновленный большими языковыми моделями (LLM), что обеспечивает более быструю конвергенцию и значительно повышенную точность, особенно для небольших объектов и периферийных устройств.

ФункциональностьYOLO26YOLOv5
АрхитектураNMS сквознойНа основе якоря с NMS
ОптимизаторMuSGD (вдохновленный LLM)SGD Adam
Скорость инференсаДо 43% быстрее на CPUСтандартный режим реального времени
ЗадачиDetect, Segment, Classify, Оценка позы, OBBОбнаружение, Сегментация, Классификация
Лучше всего подходит дляEdge AI,CPU в реальном времени, робототехникаОбщее назначение, поддержка устаревших версий

Ориентиры производительности

В следующей таблице представлено сравнение моделей на наборе COCO . YOLO26 демонстрирует существенное преимущество как по точности (mAP), так и в скорости вывода, особенно на CPU , где эффективная обработка имеет решающее значение.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Примечание о производительности

YOLO26n обеспечивает значительное улучшение mAP на 46% по сравнению с YOLOv5n, при этом работая почти в 2 раза быстрее на процессорах. Это делает его идеальным выбором для мобильных приложений и периферийного искусственного интеллекта.

YOLO26: Новый стандарт для периферийного ИИ

YOLO26 разработан для решения сложных задач современных конвейеров развертывания. Благодаря устранению необходимости в NMS и распределении фокальной потери (DFL), модель упрощает экспорт в такие форматы, как ONNX и TensorRT, снижая изменчивость задержки.

Ключевые архитектурные инновации

  1. End-to-End NMS: архитектура модели напрямую прогнозирует одну ограничивающую рамку для каждого объекта, устраняя эвристический NMS . Это снижает вычислительную нагрузку во время инференса — техника, впервые примененная в YOLOv10.
  2. MuSGD Optimizer: адаптируя инновации из обучения LLM, YOLO26 использует гибрид SGD Muon (вдохновленный Kimi K2 от Moonshot AI). Это приводит к более стабильной динамике обучения и более быстрой конвергенции, снижая стоимость обучения пользовательских моделей.
  3. ProgLoss + STAL: интеграция Progressive Loss и Soft-Target Anchor Loss значительно улучшает обнаружение небольших объектов, что является критически важным требованием для изображений с дронов и автономных транспортных средств.
  4. Эффективность: благодаря ускорению CPU до 43%, YOLO26 оптимизирован для устройств, не оснащенных мощными графическими процессорами, таких как стандартные ноутбуки и Raspberry Pi.

Узнайте больше о YOLO26

YOLOv5: наследие удобства использования

YOLOv5 изменил ландшафт компьютерного зрения, поставив во главу угла пользовательский опыт. Его интуитивная PyTorch и надежная экосистема установили планку для развития ИИ по принципу «от нуля до героя».

  • Простота использования: известный своей простой структурой каталогов и интерфейсом «train.py», YOLOv5 фаворитом для образовательных целей и быстрого прототипирования.
  • Широкая совместимость: обширная поддержка форматов экспорта гарантирует работу практически на любом оборудовании, от Apple CoreML до Android TFLite.
  • Поддержка сообщества: Многолетняя активная разработка позволила создать обширную библиотеку учебных материалов, сторонних интеграций и исправлений, созданных сообществом.

Узнайте больше о YOLOv5

Сравнение вариантов использования

Выбор между этими моделями зависит от ваших конкретных ограничений в отношении оборудования, точности и сложности задачи.

Идеальные сценарии для YOLO26

  • Edge Computing & IoT: Удаление DFL и NMS YOLO26 исключительно быстрым на CPU и NPU. Он идеально подходит для интеллектуальных камер, аналитики в розничной торговле и промышленных датчиков.
  • Робототехника и навигация: комплексная конструкция обеспечивает детерминированную задержку, что имеет решающее значение для контуров управления в реальном времени в робототехнике.
  • Расширенные задачи: если вам требуется оценка положения с помощью оценки остаточной логарифмической вероятности (RLE) или высокоточного обнаружения ориентированных ограничивающих прямоугольников (OBB) для аэрофотоснимков, YOLO26 предлагает специализированные архитектурные головки, которых YOLOv5 .
  • Обнаружение мелких объектов: благодаря ProgLoss, YOLO26 превосходно обнаруживает мелкие объекты, такие как производственные дефекты или удаленные объекты на записях камер видеонаблюдения.

Идеальные сценарии использования для YOLOv5

  • Устаревшие системы: для проектов, уже глубоко интегрированных с YOLOv5 , может быть экономически выгодным сохранить текущую модель, если ее производительность соответствует требованиям.
  • Образовательные семинары: его простая кодовая база отлично подходит для обучения основам сверточных нейронных сетей (CNN).

Обучение и экосистема

Обе модели используют преимущества надежной Ultralytics , но YOLO26 отличается более высокой эффективностью.

Эффективность обучения

YOLO26 использует оптимизатор MuSGD, который стабилизирует обучение при различных размерах партий и скоростях обучения. Это часто приводит к тому, что для достижения сходимости требуется меньше эпох по сравнению со стандартным SGD YOLOv5, что позволяет сэкономить на GPU затратах GPU .

Требования к памяти

Ultralytics славятся своей эффективностью. YOLO26 продолжает эту тенденцию, требуя значительно меньше CUDA , чем альтернативные решения на основе трансформеров, такие как RT-DETR. Это позволяет разработчикам обучать более крупные модели на потребительских графических процессорах, таких как NVIDIA 3060 или 4090.

Ultralytics

Обе модели полностью интегрированы с Ultralytics , которая оптимизирует весь рабочий процесс:

  • Управление наборами данных: загрузка и аннотирование данных с помощью искусственного интеллекта.
  • Обучение в один клик: обучайтесь в облаке без необходимости управления инфраструктурой.
  • Развертывание: автоматический экспорт в TensorRT, OpenVINO и другие платформы для производства.

Заключение

В то время как YOLOv5 остается уважаемой классикой, определившей целое поколение детекторов объектов, YOLO26 является лучшим выбором для новых проектов в 2026 году. Его архитектурные усовершенствования, в частности, конструкция NMS и оптимизатор MuSGD, обеспечивают более быструю, точную и простую в развертывании на периферийных устройствах модель.

Для разработчиков, стремящихся к оптимальному балансу скорости и точности, YOLO26 обеспечивает перспективную основу. Мы рекомендуем перенести устаревшие YOLOv5 на YOLO26, чтобы воспользоваться этими значительными преимуществами в производительности.

Авторы и ссылки

YOLO26

YOLOv5

  • Авторы: Гленн Джокер
  • Организация:Ultralytics
  • Дата: 2020-06-26
  • Документация:YOLOv5

Если вы заинтересованы в изучении других современных архитектур, рекомендуем ознакомиться со статьей YOLO11 для задач общего назначения в области машинного зрения или RT-DETR для обнаружения на основе трансформатора.


Комментарии