YOLO26 против YOLOv7: поколенческий скачок в компьютерном зрении

За последнее десятилетие область обнаружения объектов претерпела быструю эволюцию, и семейство YOLO You Only Look Once) неизменно лидирует по производительности в режиме реального времени. Двумя важными вехами в этой линейке являются YOLOv7, выпущенная в середине 2022 года, и передовая YOLO26, выпущенная в начале 2026 года. В то время как YOLOv7 концепцию «bag-of-freebies» для оптимизации обучения без увеличения затрат на вывод, YOLO26 представляет собой сдвиг парадигмы с ее сквозной архитектурой NMS и CPU дизайном.

В этом руководстве представлено подробное техническое сравнение, которое поможет разработчикам, исследователям и инженерам выбрать подходящую модель для конкретных задач развертывания, будь то высокопроизводительные графические процессоры или периферийные устройства с ограниченными ресурсами.

Обзор модели и авторство

Понимание происхождения этих моделей помогает контекстуализировать их архитектурные решения и предполагаемые варианты использования.

YOLO26

YOLO26 — это новейшая версия от Ultralytics, разработанная для решения постоянных проблем, связанных со сложностью развертывания и задержкой на периферии. В ней представлен сквозной конвейер (E2E), который устраняет необходимость в подавлении не максимальных значений (NMS), значительно упрощая путь от обучения до производства.

Авторы: Гленн Джохер, Цзин Цю
Организация:Ultralytics
Дата: 14 января 2026 года
Ключевые инновации: сквозное обнаружение NMS, оптимизатор MuSGD и оптимизация CPU.

Узнайте больше о YOLO26

YOLOv7

YOLOv7 стал знаковым выпуском, в котором основное внимание уделялось обучаемым методам оптимизации «bag-of-freebies», которые повышают точность во время обучения без дополнительных затрат во время вывода. Он установил новые передовые стандарты для детекторов объектов в реальном времени в 2022 году.

Авторы: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
Организация: Институт информатики, Academia Sinica
Дата: 6 июля 2022 года
Arxiv:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art
Ключевая инновация: перепараметризация E-ELAN и масштабирование соединений.

Узнайте больше о YOLOv7

Архитектурное сравнение

Архитектурные различия между YOLO26 и YOLOv7 их преимущества в скорости, точности и простоте внедрения.

YOLO26: Сквозная революция

YOLO26 кардинально меняет процесс обнаружения благодаря использованию сквозной конструкции NMS. Традиционные детекторы, включая YOLOv7, выдают тысячи кандидатов в рамок, которые необходимо отфильтровать с помощью немаксимального подавления (NMS). Этот этап постобработки часто занимает много времени, чувствителен к гиперпараметрам и сложен для развертывания на специализированном оборудовании, таком как FPGA или NPU.

YOLO26 NMS устраняет NMS за счет обучения однозначному сопоставлению во время тренировки. В сочетании с удалением Distribution Focal Loss (DFL) это приводит к созданию структуры модели, которую гораздо проще экспортировать в такие форматы, как ONNX или TensorRT. Кроме того, YOLO26 использует оптимизатор MuSGD, гибрид SGD Muon (вдохновленный обучением LLM), обеспечивающий стабильную конвергенцию даже с его новой архитектурой.

YOLOv7: Bag-of-Freebies и E-ELAN

YOLOv7 на архитектурной эффективности за счет расширенных сетей агрегации эффективных слоев (E-ELAN). Такая конструкция позволяет сети обучаться более разнообразным функциям за счет контроля самых коротких и самых длинных градиентных путей. Она в значительной степени опирается на методы перепараметризации, при которых сложная структура обучения упрощается до оптимизированной структуры вывода. Несмотря на высокую эффективность с точки зрения GPU , этот подход сохраняет зависимость от NMS, что может стать узким местом на CPU или при чрезвычайно высокой плотности объектов.

Почему важен NMS-Free

На периферийных устройствах NMS часто не может быть эффективно параллелизована. Благодаря ее удалению YOLO26 достигает до 43% более быстрой инференции на CPU по сравнению с предшественниками, основанными на анкерах, что делает его превосходным выбором для Raspberry Pi, мобильных телефонов и датчиков IoT.

Метрики производительности

В таблице ниже показаны улучшения производительности YOLO26 по сравнению с YOLOv7. Хотя YOLOv7 сильным конкурентом на высокопроизводительных графических процессорах, YOLO26 превосходит его по эффективности, размеру модели и CPU .

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

Основные выводы:

Эффективность: модель YOLO26l превосходит YOLOv7l на +3,6 mAP, используя на 32% меньше параметров и на 17% меньше FLOP.
Скорость: YOLO26n (Nano) предлагает невероятную отправную точку для пограничного ИИ, работая с частотой почти 40 мс на CPU, что является показателем, с которым архитектура YOLOv7 не может легко сравниться из-за NMS .
Точность: в верхнем диапазоне YOLO26x расширяет границы до 57,5 mAP, что значительно превышает показатель YOLOv7x в 53,1 mAP.

Случаи использования и приложения

Выбор между этими моделями часто зависит от среды развертывания и конкретных требований приложения.

Когда выбирать YOLO26

YOLO26 — рекомендуемый выбор для большинства современных проектов в области компьютерного зрения, особенно для тех, в которых приоритетными являются:

Edge Computing: благодаря ускоренной на 43% CPU , он отлично работает на таких устройствах, как Raspberry Pi или NVIDIA Nano.
Упрощенное развертывание: конструкция NMS упрощает экспорт в CoreML (iOS) или TFLite Android), что позволяет избежать типичных проблем с поддержкой операторов.
Обнаружение мелких объектов: Улучшенные функции потери ProgLoss + STAL обеспечивают заметные преимущества при обнаружении мелких объектов, что имеет решающее значение для анализа аэрофотоснимков и инспекций с помощью дронов.
Разнообразные задачи: помимо обнаружения, YOLO26 изначально поддерживает оценку позы, сегментацию экземпляров и ориентированные ограничительные рамки (OBB).

Когда стоит рассмотреть YOLOv7

YOLOv7 актуален для устаревших систем или конкретных исследовательских тестов, в которых основное внимание уделяется методологии «bag-of-freebies».

Устаревшие GPU : если система уже сильно оптимизирована для конкретных выходов YOLOv7 на основе анкоров YOLOv7 высокопроизводительных GPU (таких как V100 или A100), миграция может быть отложена.
Академические исследования: Исследователи, изучающие эффекты оптимизации градиентного пути и перепараметризации, часто используют YOLOv7 базового уровня.

Преимущество экосистемы Ultralytics

Одной из наиболее веских причин для внедрения YOLO26 является его глубокая интеграция в Ultralytics . В отличие от автономных репозиториев, Ultralytics используют преимущества унифицированной, хорошо поддерживаемой платформы.

Простота использования: философия «от нуля до героя» означает, что вы можете перейти от установки к обучению за считанные минуты. Python остается неизменным во всех версиях, поэтому обновление с YOLOv8 на YOLO26 требует изменения всего одной строки.
Эффективность обучения: Ultralytics оптимизированы для более быстрого обучения и использования меньшего CUDA по сравнению с альтернативными решениями на основе трансформаторов (такими как RT-DETR). Это позволяет использовать более крупные пакеты данных на потребительских графических процессорах.
Ultralytics : пользователи могут использовать Ultralytics для визуализации наборов данных, обучения моделей в облаке и развертывания одним щелчком мыши.

Пример кода: Обучение и инференс

Следующий код демонстрирует, как использовать Ultralytics для загрузки и обучения новейшей модели YOLO26. API абстрагирует сложную настройку, делая ее доступной даже для начинающих.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended for new projects)
# The 'n' suffix denotes the Nano version, optimized for speed.
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The system automatically handles dataset downloads and configuration.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
# The NMS-free output ensures fast and clean results.
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the results
predictions[0].show()

Заключение

В то время как YOLOv7 поворотным моментом в истории обнаружения объектов, YOLO26 представляет собой будущее. Его сквозная архитектура не только улучшает такие показатели производительности, как mAP задержка, но и существенно упрощает рабочий процесс развертывания для разработчиков. Устранив зависимость от NMS оптимизировав работу для CPU пограничных сред, YOLO26 гарантирует, что современное компьютерное зрение будет доступным, эффективным и достаточно универсальным для реальных приложений, от автономных транспортных средств до аналитики умных городов.

Для тех, кто заинтересован в изучении других современных архитектур, в документации также рассматриваются YOLO11 и YOLOv10, которые предлагают различные компромиссные решения в рамках непрерывного развития искусственного интеллекта в области зрения.