Перейти к содержанию

YOLO26 против YOLOv7: Всестороннее техническое сравнение

Эволюция обнаружения объектов в реальном времени ознаменовалась многочисленными вехами, при этом Ultralytics YOLO26 и YOLOv7 представляют собой два значительных скачка в возможностях компьютерного зрения. В то время как YOLOv7 представила мощную методологию «bag-of-freebies», которая переопределила эталоны точности в 2022 году, недавно выпущенная архитектура YOLO26 является пионером оптимизаций, ориентированных на периферийные устройства, нативной сквозной обработки и стабильной динамики обучения, вдохновленной инновациями больших языковых моделей (LLM).

Этот углубленный анализ сравнивает две эти архитектуры, анализируя их метрики производительности, структурные различия и идеальные сценарии развертывания, чтобы помочь инженерам машинного обучения принимать обоснованные решения для их следующего проекта в области компьютерного зрения на базе ИИ.

Общие сведения о модели и подробности

Прежде чем рассматривать данные о производительности, важно понять истоки и основные цели каждой модели.

Ultralytics YOLO26

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2026-01-14
GitHub:Репозиторий Ultralytics
Документация:Документация YOLO26

Узнайте больше о YOLO26

YOLOv7

Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
Организация:Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv:Статья YOLOv7
GitHub:Репозиторий YOLOv7

Узнайте больше о YOLOv7

Альтернативные модели для рассмотрения

Если вы изучаете более широкую экосистему, вас также могут заинтересовать YOLO11 для высокосбалансированных многозадачных развертываний или RT-DETR на основе трансформеров для детектирования на основе последовательностей. Обратите внимание, что старые модели, такие как YOLOv8 и YOLOv5, по-прежнему полностью поддерживаются на платформе Ultralytics для интеграции с устаревшими системами.

Архитектурное Глубокое Погружение

Архитектурные философии, лежащие в основе YOLO26 и YOLOv7, значительно расходятся, отражая переход от максимизации производительности высокопроизводительных GPU к оптимизации для бесшовного, сквозного развертывания на периферийных устройствах.

YOLO26: Парадигма, ориентированная на периферийные устройства

Выпущенный в 2026 году, YOLO26 фундаментально переосмысливает конвейер развертывания. Его наиболее значительным прорывом является сквозная архитектура без NMS. Устраняя постобработку Non-Maximum Suppression (NMS), YOLO26 значительно снижает изменчивость задержки — концепция, которая была впервые успешно опробована в YOLOv10. Это обеспечивает стабильную частоту кадров даже в сценах с высокой плотностью объектов, что критически важно для автономной робототехники и мониторинга трафика.

Кроме того, YOLO26 полностью исключает Distribution Focal Loss (DFL). Это удаление DFL упрощает процесс экспорта в такие форматы, как ONNX и Apple CoreML, достигая до 43% более быстрого инференса на CPU.

Стабильность обучения — еще один важный аспект. Внедрение оптимизатора MuSGD — гибрида стандартного стохастического градиентного спуска и Muon (вдохновленного динамикой обучения Kimi K2) — привносит передовую стабильность обучения LLM в компьютерное зрение. В сочетании с функциями потерь ProgLoss + STAL, YOLO26 превосходно справляется с распознаванием мелких объектов, что является исторической проблемой для детекторов реального времени.

YOLOv7: Мастерство «Бесплатных приемов»

YOLOv7 был разработан на основе исчерпывающего исследования оптимизации градиентного пути. Его ключевой инновацией является расширенная эффективная сеть агрегации слоев (E-ELAN), которая позволяет модели изучать более разнообразные признаки, не нарушая исходные градиентные пути.

Архитектура YOLOv7 также активно использует методы репараметризации во время инференса, по сути, объединяя слои для увеличения скорости без ущерба для богатых представлений признаков, полученных во время обучения. Хотя этот подход эффективен на стандартных серверных GPU с NVIDIA TensorRT, он по-прежнему основан на якорных детекционных головах и традиционном NMS, что может создавать трудности при развертывании на маломощных устройствах.

Сравнение производительности

В таблице ниже представлено прямое сравнение моделей, обученных на стандартном наборе данных COCO. YOLO26 демонстрирует значительные улучшения в точности (mAP), сохраняя при этом исключительный баланс параметров и FLOPs.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Примечание: YOLO26x превосходит YOLOv7x по mAP со значительным отрывом (57.5 против 53.1), при этом требуя примерно на 22% меньше параметров и меньше FLOPs.

Преимущество экосистемы Ultralytics

Основная причина, по которой разработчики постоянно выбирают YOLO26, — это его глубокая интеграция в платформу Ultralytics. В отличие от автономных скриптов, необходимых для старых архитектур, Ultralytics обеспечивает бесшовный, унифицированный рабочий процесс.

  1. Простота использования: Python API позволяет пользователям загружать, обучать и развертывать модели всего в нескольких строках кода. Экспорт в мобильные форматы, такие как TensorFlow Lite, требует лишь изменения одного аргумента.
  2. Требования к памяти: Модели Ultralytics тщательно спроектированы для эффективности обучения. Они требуют значительно меньше памяти CUDA по сравнению с тяжелыми моделями-трансформерами для зрения, что позволяет исследователям запускать большие размеры пакетов на потребительском оборудовании.
  3. Универсальность: В то время как YOLOv7 требует совершенно разных репозиториев для разных задач, YOLO26 нативно поддерживает классификацию изображений, сегментацию экземпляров, оценку позы и detect ориентированных ограничивающих рамок (OBB) из единой, целостной библиотеки. Она даже включает функции потерь, специфичные для задач, такие как Residual Log-Likelihood Estimation (RLE) для конвейеров оценки позы человека.
  4. Активная разработка: Открытое сообщество Ultralytics предоставляет частые обновления, обеспечивая быстрое разрешение пограничных случаев и постоянную совместимость с последними выпусками PyTorch.

Оптимизированный экспорт

Поскольку YOLO26 изначально не требует NMS, развертывание на встраиваемых устройствах с использованием Intel OpenVINO или ONNX Runtime полностью исключает сложные скрипты постобработки.

Реальные примеры использования

Архитектурные различия между этими моделями определяют их идеальные сценарии развертывания.

Когда выбирать YOLO26

YOLO26 является бесспорной рекомендацией для современных, перспективных систем компьютерного зрения.

  • Периферийный ИИ и IoT: Благодаря ускоренному на 43% выводу на CPU и небольшому количеству параметров, YOLO26n идеально подходит для устройств с ограниченными ресурсами, таких как Raspberry Pi или камеры умного города.
  • Дроны и аэрофотосъемка: Интеграция ProgLoss + STAL значительно улучшает detect мелких объектов, что делает его лучшим выбором для инспекции трубопроводов и точного земледелия.
  • Многозадачная робототехника: Поскольку он легко обрабатывает ограничивающие рамки, маски сегментации и ключевые точки позы одновременно с минимальными накладными расходами памяти, он хорошо подходит для динамической роботизированной навигации и взаимодействия.

Когда стоит рассмотреть YOLOv7

Хотя YOLOv7 в основном вытеснена новыми архитектурами, она сохраняет определенные нишевые применения.

  • Академическое сравнительное тестирование: Исследователи, разрабатывающие новые детекционные головы на основе якорей или изучающие стратегии градиентного пути, часто используют YOLOv7 в качестве стандартной базовой модели для сравнения на таких платформах, как Papers With Code.
  • Устаревшие конвейеры GPU: Корпоративные системы, разработанные специально для конкретных тензорных выходов YOLOv7 и пользовательских конфигураций NMS на мощных экземплярах AWS EC2 P4d, могут отложить миграцию на новые модели до тех пор, пока не потребуется полная переработка системы.

Пример кода: Начало работы

Опыт разработчика подчеркивает резкий контраст между стандартными исследовательскими репозиториями и экосистемой Ultralytics. Обучение пользовательской модели YOLO26 удивительно просто:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model for edge deployment
model.export(format="onnx")

В заключение

Хотя YOLOv7 остается уважаемой вехой в истории обнаружения объектов в реальном времени, индустрия активно движется к моделям, которые отдают приоритет простоте развертывания, многозадачной универсальности и эффективности на периферийных устройствах.

Устранение NMS, внедрение оптимизатора MuSGD и значительное улучшение скорости инференса на CPU делают Ultralytics YOLO26 окончательным выбором для разработчиков и корпоративных инженеров сегодня. В сочетании с надёжной и удобной экосистемой Ultralytics он обеспечивает беспрецедентный баланс скорости, точности и удовольствия от разработки.


Комментарии