Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 против YOLOv7: исчерпывающее техническое сравнение#

Эволюция детектирования объектов в реальном времени прошла множество этапов, и Ultralytics YOLO26 вместе с YOLOv7 представляют собой два значительных скачка в возможностях компьютерного зрения. В то время как YOLOv7 представила мощную методологию «bag-of-freebies», которая переопределила стандарты точности в 2022 году, новая архитектура YOLO26 является пионером оптимизаций для периферийных вычислений (edge-first), нативной сквозной обработки (end-to-end) и стабильной динамики обучения, вдохновленной инновациями в области больших языковых моделей (LLM).

В этом глубоком обзоре мы сравниваем две эти архитектуры, анализируя их метрики производительности, структурные различия и идеальные сценарии развертывания, чтобы помочь инженерам по машинному обучению принимать обоснованные решения для своих следующих проектов в области AI компьютерного зрения.

Link to this sectionИстория создания и детали моделей#

Прежде чем изучать данные о производительности, важно понять происхождение и основные цели каждой из моделей.

Link to this sectionUltralytics YOLO26#

Авторы: Гленн Джочер (Glenn Jocher) и Цзин Цю (Jing Qiu)
Организация: Ultralytics
Дата: 2026-01-14
GitHub: Репозиторий Ultralytics
Документация: Документация YOLO26

Узнай больше о YOLO26

Link to this sectionYOLOv7#

Авторы: Чиен-Яо Ван (Chien-Yao Wang), Алексей Бочковский и Хун-Юань Марк Ляо (Hong-Yuan Mark Liao)
Организация: Институт информационных наук, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: Статья о YOLOv7
GitHub: Репозиторий YOLOv7

Узнай больше о YOLOv7

Альтернативные модели для рассмотрения

Если ты изучаешь более широкую экосистему, тебе также могут быть интересны YOLO11 для сбалансированных многозадачных развертываний или модель на базе Transformer RT-DETR для последовательного детектирования. Обрати внимание, что старые модели, такие как YOLOv8 и YOLOv5, полностью поддерживаются на платформе Ultralytics для интеграции с устаревшим кодом.

Link to this sectionГлубокое изучение архитектуры#

Архитектурные философии YOLO26 и YOLOv7 значительно расходятся, отражая переход от максимизации производительности GPU высокого класса к оптимизации для бесшовного сквозного развертывания на периферийных устройствах (edge deployment).

Link to this sectionYOLO26: парадигма Edge-First#

Выпущенная в 2026 году, YOLO26 фундаментально переосмысливает процесс развертывания. Ее самым значительным прорывом является End-to-End NMS-Free Design. Устраняя пост-обработку Non-Maximum Suppression (NMS), YOLO26 радикально снижает изменчивость задержки (latency) — концепцию, которая была впервые успешно опробована в YOLOv10. Это обеспечивает стабильную частоту кадров даже в сценах с высокой плотностью объектов, что критически важно для автономной робототехники и систем мониторинга дорожного движения.

Более того, YOLO26 полностью удаляет Distribution Focal Loss (DFL). Это DFL Removal упрощает процесс экспорта в такие форматы, как ONNX и Apple CoreML, обеспечивая до 43% более быстрое выполнение CPU inference.

Стабильность обучения — еще один важный фокус. Внедрение оптимизатора MuSGD — гибрида стандартного Stochastic Gradient Descent и Muon (вдохновленного динамикой обучения Kimi K2) — приносит передовую стабильность обучения LLM в сферу компьютерного зрения. В сочетании с функциями потерь ProgLoss + STAL, YOLO26 отлично справляется с распознаванием мелких объектов, что исторически было сложной задачей для детекторов реального времени.

Link to this sectionYOLOv7: мастерство Bag-of-Freebies#

YOLOv7 была создана на основе исчерпывающего исследования оптимизации путей градиента. Ее ключевая инновация — Extended Efficient Layer Aggregation Network (E-ELAN), которая позволяет модели изучать более разнообразные признаки, не нарушая исходные пути градиентов.

Архитектура YOLOv7 также в значительной степени опирается на методы репараметризации во время вывода, по сути объединяя слои для увеличения скорости без ущерба для богатых представлений признаков, полученных во время обучения. Несмотря на эффективность на серверных GPU NVIDIA TensorRT, этот подход все еще опирается на anchor-based головы детектирования и традиционный NMS, что может вызывать сложности при развертывании на маломощных устройствах.

Link to this sectionСравнение производительности#

В таблице ниже приведено прямое сравнение моделей, обученных на стандартном наборе данных COCO. YOLO26 демонстрирует значительные улучшения в точности (mAP) при сохранении исключительного баланса параметров и FLOPs.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Примечание: YOLO26x превосходит YOLOv7x по mAP с впечатляющим отрывом (57.5 против 53.1), требуя при этом примерно на 22% меньше параметров.

Link to this sectionПреимущества экосистемы Ultralytics#

Основная причина, по которой разработчики постоянно выбирают YOLO26, заключается в ее глубокой интеграции в платформу Ultralytics. В отличие от отдельных скриптов, необходимых для старых архитектур, Ultralytics предоставляет бесшовный и унифицированный рабочий процесс.

  1. Простота использования: Python API позволяет тебе загружать, обучать и развертывать модели всего за несколько строк кода. Экспорт в мобильные форматы, такие как TensorFlow Lite, требует лишь изменения одного аргумента.
  2. Требования к памяти: Модели Ultralytics тщательно разработаны для эффективности обучения. Они требуют значительно меньше памяти CUDA по сравнению с тяжелыми моделями Vision Transformer, что позволяет исследователям запускать обучение с большими размерами батчей (batch sizes) на потребительском оборудовании.
  3. Универсальность: В то время как для YOLOv7 требуются совершенно разные репозитории для разных задач, YOLO26 нативно поддерживает классификацию изображений, сегментацию экземпляров, оценку позы и детектирование с помощью ориентированных ограничивающих рамок (OBB) из одной целостной библиотеки. Она даже включает специализированные функции потерь, такие как Residual Log-Likelihood Estimation (RLE) для конвейеров оценки позы человека.
  4. Активная разработка: Open-source сообщество Ultralytics предоставляет частые обновления, обеспечивая быстрое решение граничных случаев и постоянную совместимость с последними релизами PyTorch.
Упрощенный экспорт

Поскольку YOLO26 нативно не использует NMS, развертывание на целевых встраиваемых системах с помощью Intel OpenVINO или ONNX Runtime полностью исключает сложные скрипты пост-обработки.

Link to this sectionРеальные сценарии использования#

Архитектурные различия между этими моделями диктуют их идеальные сценарии развертывания.

Link to this sectionКогда стоит выбрать YOLO26#

YOLO26 — это бесспорная рекомендация для современных и перспективных систем компьютерного зрения.

  • Edge AI и IoT: Благодаря на 43% более быстрому логическому выводу на CPU и небольшому количеству параметров, YOLO26n идеально подходит для устройств с ограниченными ресурсами, таких как Raspberry Pi или камеры умного города.
  • Дроны и аэрофотосъемка: Интеграция ProgLoss + STAL радикально улучшает детектирование мелких объектов, что делает эту модель лучшим выбором для инспекций трубопроводов и точного земледелия.
  • Многозадачная робототехника: Поскольку она легко обрабатывает ограничивающие рамки, маски сегментации и ключевые точки позы одновременно с минимальными затратами памяти, она отлично подходит для динамической навигации роботов и взаимодействия с ними.

Link to this sectionКогда стоит рассмотреть YOLOv7#

Хотя YOLOv7 по большей части была вытеснена более новыми архитектурами, она сохраняет специфические нишевые возможности использования.

  • Академическое сравнение: Исследователи, разрабатывающие новые anchor-based головы детектирования или изучающие стратегии градиентных путей, часто используют YOLOv7 в качестве стандартного базового уровня для сравнения на платформах типа Papers With Code.
  • Устаревшие GPU-конвейеры: Корпоративные системы, которые были специально настроены под тензорные выходы YOLOv7 и специфические конфигурации NMS на мощных экземплярах AWS EC2 P4d, могут отложить переход на новые модели до тех пор, пока не потребуется полная переработка системы.

Link to this sectionПример кода: с чего начать#

Опыт разработчика подчеркивает резкий контраст между стандартными исследовательскими репозиториями и экосистемой Ultralytics. Обучение кастомной модели YOLO26 невероятно просто:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model for edge deployment
model.export(format="onnx")

Link to this sectionЗаключительные мысли#

Хотя YOLOv7 остается уважаемой вехой в истории детектирования объектов в реальном времени, отрасль агрессивно движется к моделям, которые отдают приоритет простоте развертывания, многозадачности и эффективности на периферии.

Благодаря исключению NMS, внедрению оптимизатора MuSGD и значительному увеличению скорости логического вывода на CPU, Ultralytics YOLO26 сегодня является окончательным выбором для разработчиков и корпоративных инженеров. В сочетании с надежной и удобной экосистемой Ultralytics, она обеспечивает непревзойденный баланс скорости, точности и удовольствия от инженерной работы.

Авторы

Комментарии