Перейти к содержанию

YOLO26 против YOLOv7: поколенческий скачок в компьютерном зрении

За последнее десятилетие область обнаружения объектов претерпела быструю эволюцию, и семейство YOLO You Only Look Once) неизменно лидирует по производительности в режиме реального времени. Двумя важными вехами в этой линейке являются YOLOv7, выпущенная в середине 2022 года, и передовая YOLO26, выпущенная в начале 2026 года. В то время как YOLOv7 концепцию «bag-of-freebies» для оптимизации обучения без увеличения затрат на вывод, YOLO26 представляет собой сдвиг парадигмы с ее сквозной архитектурой NMS и CPU дизайном.

В этом руководстве представлено подробное техническое сравнение, которое поможет разработчикам, исследователям и инженерам выбрать подходящую модель для конкретных задач развертывания, будь то высокопроизводительные графические процессоры или периферийные устройства с ограниченными ресурсами.

Обзор модели и авторство

Понимание происхождения этих моделей помогает контекстуализировать их архитектурные решения и предполагаемые варианты использования.

YOLO26

YOLO26 — это новейшая версия от Ultralytics, разработанная для решения постоянных проблем, связанных со сложностью развертывания и задержкой на периферии. В ней представлен сквозной конвейер (E2E), который устраняет необходимость в подавлении не максимальных значений (NMS), значительно упрощая путь от обучения до производства.

  • Авторы: Гленн Джохер, Цзин Цю
  • Организация:Ultralytics
  • Дата: 14 января 2026 года
  • Ключевые инновации: сквозное обнаружение NMS, оптимизатор MuSGD и оптимизация CPU.

Узнайте больше о YOLO26

YOLOv7

YOLOv7 стал знаковым выпуском, в котором основное внимание уделялось обучаемым методам оптимизации «bag-of-freebies», которые повышают точность во время обучения без дополнительных затрат во время вывода. Он установил новые передовые стандарты для детекторов объектов в реальном времени в 2022 году.

  • Авторы: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
  • Организация: Институт информатики, Academia Sinica
  • Дата: 6 июля 2022 года
  • Arxiv:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art
  • Ключевая инновация: перепараметризация E-ELAN и масштабирование соединений.

Узнайте больше о YOLOv7

Архитектурное сравнение

Архитектурные различия между YOLO26 и YOLOv7 их преимущества в скорости, точности и простоте внедрения.

YOLO26: Сквозная революция

YOLO26 кардинально меняет процесс обнаружения благодаря использованию сквозной конструкции NMS. Традиционные детекторы, включая YOLOv7, выдают тысячи кандидатов в рамок, которые необходимо отфильтровать с помощью немаксимального подавления (NMS). Этот этап постобработки часто занимает много времени, чувствителен к гиперпараметрам и сложен для развертывания на специализированном оборудовании, таком как FPGA или NPU.

YOLO26 NMS устраняет NMS за счет обучения однозначному сопоставлению во время тренировки. В сочетании с удалением Distribution Focal Loss (DFL) это приводит к созданию структуры модели, которую гораздо проще экспортировать в такие форматы, как ONNX или TensorRT. Кроме того, YOLO26 использует оптимизатор MuSGD, гибрид SGD Muon (вдохновленный обучением LLM), обеспечивающий стабильную конвергенцию даже с его новой архитектурой.

YOLOv7: Bag-of-Freebies и E-ELAN

YOLOv7 на архитектурной эффективности за счет расширенных сетей агрегации эффективных слоев (E-ELAN). Такая конструкция позволяет сети обучаться более разнообразным функциям за счет контроля самых коротких и самых длинных градиентных путей. Она в значительной степени опирается на методы перепараметризации, при которых сложная структура обучения упрощается до оптимизированной структуры вывода. Несмотря на высокую эффективность с точки зрения GPU , этот подход сохраняет зависимость от NMS, что может стать узким местом на CPU или при чрезвычайно высокой плотности объектов.

Почему важен NMS-Free

На периферийных устройствах NMS часто не может быть эффективно параллелизована. Благодаря ее удалению YOLO26 достигает до 43% более быстрой инференции на CPU по сравнению с предшественниками, основанными на анкерах, что делает его превосходным выбором для Raspberry Pi, мобильных телефонов и датчиков IoT.

Метрики производительности

В таблице ниже показаны улучшения производительности YOLO26 по сравнению с YOLOv7. Хотя YOLOv7 сильным конкурентом на высокопроизводительных графических процессорах, YOLO26 превосходит его по эффективности, размеру модели и CPU .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Основные выводы:

  • Эффективность: модель YOLO26l превосходит YOLOv7l на +3,6 mAP, используя на 32% меньше параметров и на 17% меньше FLOP.
  • Скорость: YOLO26n (Nano) предлагает невероятную отправную точку для пограничного ИИ, работая с частотой почти 40 мс на CPU, что является показателем, с которым архитектура YOLOv7 не может легко сравниться из-за NMS .
  • Точность: в верхнем диапазоне YOLO26x расширяет границы до 57,5 mAP, что значительно превышает показатель YOLOv7x в 53,1 mAP.

Случаи использования и приложения

Выбор между этими моделями часто зависит от среды развертывания и конкретных требований приложения.

Когда выбирать YOLO26

YOLO26 — рекомендуемый выбор для большинства современных проектов в области компьютерного зрения, особенно для тех, в которых приоритетными являются:

  • Edge Computing: благодаря ускоренной на 43% CPU , он отлично работает на таких устройствах, как Raspberry Pi или NVIDIA Nano.
  • Упрощенное развертывание: конструкция NMS упрощает экспорт в CoreML (iOS) или TFLite Android), что позволяет избежать типичных проблем с поддержкой операторов.
  • Обнаружение мелких объектов: Улучшенные функции потери ProgLoss + STAL обеспечивают заметные преимущества при обнаружении мелких объектов, что имеет решающее значение для анализа аэрофотоснимков и инспекций с помощью дронов.
  • Разнообразные задачи: помимо обнаружения, YOLO26 изначально поддерживает оценку позы, сегментацию экземпляров и ориентированные ограничительные рамки (OBB).

Когда стоит рассмотреть YOLOv7

YOLOv7 актуален для устаревших систем или конкретных исследовательских тестов, в которых основное внимание уделяется методологии «bag-of-freebies».

  • Устаревшие GPU : если система уже сильно оптимизирована для конкретных выходов YOLOv7 на основе анкоров YOLOv7 высокопроизводительных GPU (таких как V100 или A100), миграция может быть отложена.
  • Академические исследования: Исследователи, изучающие эффекты оптимизации градиентного пути и перепараметризации, часто используют YOLOv7 базового уровня.

Преимущество экосистемы Ultralytics

Одной из наиболее веских причин для внедрения YOLO26 является его глубокая интеграция в Ultralytics . В отличие от автономных репозиториев, Ultralytics используют преимущества унифицированной, хорошо поддерживаемой платформы.

  • Простота использования: философия «от нуля до героя» означает, что вы можете перейти от установки к обучению за считанные минуты. Python остается неизменным во всех версиях, поэтому обновление с YOLOv8 на YOLO26 требует изменения всего одной строки.
  • Эффективность обучения: Ultralytics оптимизированы для более быстрого обучения и использования меньшего CUDA по сравнению с альтернативными решениями на основе трансформаторов (такими как RT-DETR). Это позволяет использовать более крупные пакеты данных на потребительских графических процессорах.
  • Ultralytics : пользователи могут использовать Ultralytics для визуализации наборов данных, обучения моделей в облаке и развертывания одним щелчком мыши.

Пример кода: Обучение и инференс

Следующий код демонстрирует, как использовать Ultralytics для загрузки и обучения новейшей модели YOLO26. API абстрагирует сложную настройку, делая ее доступной даже для начинающих.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended for new projects)
# The 'n' suffix denotes the Nano version, optimized for speed.
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The system automatically handles dataset downloads and configuration.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
# The NMS-free output ensures fast and clean results.
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the results
predictions[0].show()

Заключение

В то время как YOLOv7 поворотным моментом в истории обнаружения объектов, YOLO26 представляет собой будущее. Его сквозная архитектура не только улучшает такие показатели производительности, как mAP задержка, но и существенно упрощает рабочий процесс развертывания для разработчиков. Устранив зависимость от NMS оптимизировав работу для CPU пограничных сред, YOLO26 гарантирует, что современное компьютерное зрение будет доступным, эффективным и достаточно универсальным для реальных приложений, от автономных транспортных средств до аналитики умных городов.

Для тех, кто заинтересован в изучении других современных архитектур, в документации также рассматриваются YOLO11 и YOLOv10, которые предлагают различные компромиссные решения в рамках непрерывного развития искусственного интеллекта в области зрения.


Комментарии