YOLO26 против YOLOv7: поколенческий скачок в компьютерном зрении
За последнее десятилетие область обнаружения объектов претерпела быструю эволюцию, и семейство YOLO You Only Look Once) неизменно лидирует по производительности в режиме реального времени. Двумя важными вехами в этой линейке являются YOLOv7, выпущенная в середине 2022 года, и передовая YOLO26, выпущенная в начале 2026 года. В то время как YOLOv7 концепцию «bag-of-freebies» для оптимизации обучения без увеличения затрат на вывод, YOLO26 представляет собой сдвиг парадигмы с ее сквозной архитектурой NMS и CPU дизайном.
В этом руководстве представлено подробное техническое сравнение, которое поможет разработчикам, исследователям и инженерам выбрать подходящую модель для конкретных задач развертывания, будь то высокопроизводительные графические процессоры или периферийные устройства с ограниченными ресурсами.
Обзор модели и авторство
Понимание происхождения этих моделей помогает контекстуализировать их архитектурные решения и предполагаемые варианты использования.
YOLO26
YOLO26 — это новейшая версия от Ultralytics, разработанная для решения постоянных проблем, связанных со сложностью развертывания и задержкой на периферии. В ней представлен сквозной конвейер (E2E), который устраняет необходимость в подавлении не максимальных значений (NMS), значительно упрощая путь от обучения до производства.
- Авторы: Гленн Джохер, Цзин Цю
- Организация:Ultralytics
- Дата: 14 января 2026 года
- Ключевые инновации: сквозное обнаружение NMS, оптимизатор MuSGD и оптимизация CPU.
YOLOv7
YOLOv7 стал знаковым выпуском, в котором основное внимание уделялось обучаемым методам оптимизации «bag-of-freebies», которые повышают точность во время обучения без дополнительных затрат во время вывода. Он установил новые передовые стандарты для детекторов объектов в реальном времени в 2022 году.
- Авторы: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- Организация: Институт информатики, Academia Sinica
- Дата: 6 июля 2022 года
- Arxiv:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art
- Ключевая инновация: перепараметризация E-ELAN и масштабирование соединений.
Архитектурное сравнение
Архитектурные различия между YOLO26 и YOLOv7 их преимущества в скорости, точности и простоте внедрения.
YOLO26: Сквозная революция
YOLO26 кардинально меняет процесс обнаружения благодаря использованию сквозной конструкции NMS. Традиционные детекторы, включая YOLOv7, выдают тысячи кандидатов в рамок, которые необходимо отфильтровать с помощью немаксимального подавления (NMS). Этот этап постобработки часто занимает много времени, чувствителен к гиперпараметрам и сложен для развертывания на специализированном оборудовании, таком как FPGA или NPU.
YOLO26 NMS устраняет NMS за счет обучения однозначному сопоставлению во время тренировки. В сочетании с удалением Distribution Focal Loss (DFL) это приводит к созданию структуры модели, которую гораздо проще экспортировать в такие форматы, как ONNX или TensorRT. Кроме того, YOLO26 использует оптимизатор MuSGD, гибрид SGD Muon (вдохновленный обучением LLM), обеспечивающий стабильную конвергенцию даже с его новой архитектурой.
YOLOv7: Bag-of-Freebies и E-ELAN
YOLOv7 на архитектурной эффективности за счет расширенных сетей агрегации эффективных слоев (E-ELAN). Такая конструкция позволяет сети обучаться более разнообразным функциям за счет контроля самых коротких и самых длинных градиентных путей. Она в значительной степени опирается на методы перепараметризации, при которых сложная структура обучения упрощается до оптимизированной структуры вывода. Несмотря на высокую эффективность с точки зрения GPU , этот подход сохраняет зависимость от NMS, что может стать узким местом на CPU или при чрезвычайно высокой плотности объектов.
Почему важен NMS-Free
На периферийных устройствах NMS часто не может быть эффективно параллелизована. Благодаря ее удалению YOLO26 достигает до 43% более быстрой инференции на CPU по сравнению с предшественниками, основанными на анкерах, что делает его превосходным выбором для Raspberry Pi, мобильных телефонов и датчиков IoT.
Метрики производительности
В таблице ниже показаны улучшения производительности YOLO26 по сравнению с YOLOv7. Хотя YOLOv7 сильным конкурентом на высокопроизводительных графических процессорах, YOLO26 превосходит его по эффективности, размеру модели и CPU .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Основные выводы:
- Эффективность: модель YOLO26l превосходит YOLOv7l на +3,6 mAP, используя на 32% меньше параметров и на 17% меньше FLOP.
- Скорость: YOLO26n (Nano) предлагает невероятную отправную точку для пограничного ИИ, работая с частотой почти 40 мс на CPU, что является показателем, с которым архитектура YOLOv7 не может легко сравниться из-за NMS .
- Точность: в верхнем диапазоне YOLO26x расширяет границы до 57,5 mAP, что значительно превышает показатель YOLOv7x в 53,1 mAP.
Случаи использования и приложения
Выбор между этими моделями часто зависит от среды развертывания и конкретных требований приложения.
Когда выбирать YOLO26
YOLO26 — рекомендуемый выбор для большинства современных проектов в области компьютерного зрения, особенно для тех, в которых приоритетными являются:
- Edge Computing: благодаря ускоренной на 43% CPU , он отлично работает на таких устройствах, как Raspberry Pi или NVIDIA Nano.
- Упрощенное развертывание: конструкция NMS упрощает экспорт в CoreML (iOS) или TFLite Android), что позволяет избежать типичных проблем с поддержкой операторов.
- Обнаружение мелких объектов: Улучшенные функции потери ProgLoss + STAL обеспечивают заметные преимущества при обнаружении мелких объектов, что имеет решающее значение для анализа аэрофотоснимков и инспекций с помощью дронов.
- Разнообразные задачи: помимо обнаружения, YOLO26 изначально поддерживает оценку позы, сегментацию экземпляров и ориентированные ограничительные рамки (OBB).
Когда стоит рассмотреть YOLOv7
YOLOv7 актуален для устаревших систем или конкретных исследовательских тестов, в которых основное внимание уделяется методологии «bag-of-freebies».
- Устаревшие GPU : если система уже сильно оптимизирована для конкретных выходов YOLOv7 на основе анкоров YOLOv7 высокопроизводительных GPU (таких как V100 или A100), миграция может быть отложена.
- Академические исследования: Исследователи, изучающие эффекты оптимизации градиентного пути и перепараметризации, часто используют YOLOv7 базового уровня.
Преимущество экосистемы Ultralytics
Одной из наиболее веских причин для внедрения YOLO26 является его глубокая интеграция в Ultralytics . В отличие от автономных репозиториев, Ultralytics используют преимущества унифицированной, хорошо поддерживаемой платформы.
- Простота использования: философия «от нуля до героя» означает, что вы можете перейти от установки к обучению за считанные минуты. Python остается неизменным во всех версиях, поэтому обновление с YOLOv8 на YOLO26 требует изменения всего одной строки.
- Эффективность обучения: Ultralytics оптимизированы для более быстрого обучения и использования меньшего CUDA по сравнению с альтернативными решениями на основе трансформаторов (такими как RT-DETR). Это позволяет использовать более крупные пакеты данных на потребительских графических процессорах.
- Ultralytics : пользователи могут использовать Ultralytics для визуализации наборов данных, обучения моделей в облаке и развертывания одним щелчком мыши.
Пример кода: Обучение и инференс
Следующий код демонстрирует, как использовать Ultralytics для загрузки и обучения новейшей модели YOLO26. API абстрагирует сложную настройку, делая ее доступной даже для начинающих.
from ultralytics import YOLO
# Load the latest YOLO26 model (recommended for new projects)
# The 'n' suffix denotes the Nano version, optimized for speed.
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The system automatically handles dataset downloads and configuration.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
# The NMS-free output ensures fast and clean results.
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the results
predictions[0].show()
Заключение
В то время как YOLOv7 поворотным моментом в истории обнаружения объектов, YOLO26 представляет собой будущее. Его сквозная архитектура не только улучшает такие показатели производительности, как mAP задержка, но и существенно упрощает рабочий процесс развертывания для разработчиков. Устранив зависимость от NMS оптимизировав работу для CPU пограничных сред, YOLO26 гарантирует, что современное компьютерное зрение будет доступным, эффективным и достаточно универсальным для реальных приложений, от автономных транспортных средств до аналитики умных городов.
Для тех, кто заинтересован в изучении других современных архитектур, в документации также рассматриваются YOLO11 и YOLOv10, которые предлагают различные компромиссные решения в рамках непрерывного развития искусственного интеллекта в области зрения.