Перейти к содержанию

YOLOv10 против YOLO26: Сравнительный анализ

В быстро развивающейся области обнаружения объектов в реальном времени разработчики и исследователи постоянно ищут оптимальный баланс между скоростью инференса, точностью и гибкостью развертывания. Двумя важными вехами на этом пути являются YOLOv10, разработанная Университетом Цинхуа, и последующая YOLO26, новейшая флагманская модель от Ultralytics.

Хотя обе модели поддерживают переход к сквозным архитектурам, они значительно различаются в реализации, поддержке экосистемы и целевых приложениях. Данный анализ рассматривает архитектурные изменения, метрики производительности и практические соображения при выборе между этими двумя мощными инструментами компьютерного зрения на базе ИИ.

Обзор модели

YOLOv10: Пионер сквозных решений

Выпущенная в мае 2024 года исследователями из Университета Цинхуа, YOLOv10 привлекла внимание благодаря внедрению последовательной стратегии двойного назначения для обучения без NMS. Эта архитектура была направлена на устранение этапа постобработки не-максимального подавления (NMS), который исторически являлся узким местом по задержке в предыдущих версиях YOLO.

  • Авторы: Ao Wang, Hui Chen, Lihao Liu, и др.
  • Организация:Университет Цинхуа
  • Дата: 23 мая 2024 г.
  • Ключевое нововведение: Последовательное двойное назначение для обучения без NMS и целостный дизайн модели, ориентированный на эффективность и точность.

Узнайте больше о YOLOv10

YOLO26: Новый стандарт для периферийного ИИ

Выпущенная в январе 2026 года компанией Ultralytics, YOLO26 дорабатывает сквозную концепцию, впервые предложенную YOLOv10, но перестраивает фреймворк с акцентом на развертывание на периферийных устройствах, стабильность обучения и аппаратную совместимость. Она удаляет устаревшие компоненты, такие как Distribution Focal Loss (DFL), для упрощения экспортируемости и внедряет методы оптимизации, вдохновленные LLM.

  • Авторы: Гленн Джочер и Цзин Цю
  • Организация:Ultralytics
  • Дата: 14 января 2026 года
  • Ключевое нововведение: Удаление DFL, оптимизатор MuSGD (гибрид SGD/Muon) и нативная сквозная поддержка пяти задач компьютерного зрения.

Узнайте больше о YOLO26

Архитектурные различия

Переход от YOLOv10 к YOLO26 представляет собой переход от академических инноваций к надежности производственного уровня.

Сквозная архитектура и NMS

Обе модели преследуют цель устранения NMS. YOLOv10 представила концепцию двойного назначения меток—используя назначение «один-ко-многим» для полноценного обучения и назначение «один-к-одному» для инференса.

YOLO26 принимает этот нативный сквозной дизайн без NMS, но оптимизирует реализацию для обеспечения бесшовной интеграции с экосистемой Ultralytics. Генерируя предсказания напрямую без постобработки, обе модели уменьшают изменчивость задержки, что критически важно для приложений реального времени, таких как автономные транспортные средства и робототехника.

Функции потерь и оптимизация

Основное различие заключается в способе обучения моделей.

  • YOLOv10 фокусируется на дизайне, ориентированном на архитектурную эффективность и точность, оптимизируя конкретные компоненты для снижения вычислительных затрат.
  • YOLO26 представляет оптимизатор MuSGD, гибрид SGD и оптимизатора Muon (вдохновленного Kimi K2 от Moonshot AI). Это переносит методы оптимизации из обучения больших языковых моделей (LLM) в компьютерное зрение, что приводит к более быстрой сходимости и большей стабильности. Кроме того, YOLO26 использует ProgLoss и STAL (Small-Target-Aware Label Assignment), специально направленные на улучшение распознавания мелких объектов.

Простота и Экспортируемость

YOLO26 делает радикальный шаг, удаляя Distribution Focal Loss (DFL). Хотя DFL помогал с точностью ограничивающих рамок в предыдущих поколениях, он часто усложнял процесс экспорта в такие форматы, как ONNX или TensorRT, особенно для периферийных устройств. Его удаление в YOLO26 упрощает граф модели, делая ее до 43% быстрее при инференсе на CPU по сравнению с предшественниками, что делает ее высокоэффективной для периферийных вычислений.

Сравнение производительности

В следующей таблице представлены метрики производительности обеих моделей. В то время как YOLOv10 демонстрирует высокую производительность, YOLO26 показывает превосходную скорость, особенно в средах CPU, и повышенную точность в более крупных моделях.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Основные выводы

  1. Эффективность CPU: YOLO26 обеспечивает проверенную, высокооптимизированную скорость инференса на CPU, что критически важно для устройств без выделенных GPU, таких как Raspberry Pi или стандартные ноутбуки.
  2. Прирост точности: В целом, YOLO26 достигает более высоких показателей mAP, со значительными улучшениями в вариантах medium (m), large (l) и extra-large (x).
  3. Эффективность параметров: В то время как YOLOv10 стремится к низкому количеству параметров, YOLO26 оптимизирует FLOPs и архитектуру для обеспечения лучшего mAP на вычислительную единицу в реальных сценариях.

Экосистема и простота использования

При выборе модели для продакшена окружающая экосистема так же важна, как и сама архитектура.

Преимущество Ultralytics

YOLO26 выигрывает от зрелой экосистемы Ultralytics. Это включает:

Гибкость задач

Если ваш проект требует больше, чем просто ограничивающие рамки — например, понимание позы тела (Pose) или сегментацию нерегулярных объектов (Segmentation) — YOLO26 предлагает эти возможности готовыми к использованию с тем же простым API.

Эффективность обучения

Модели YOLO26 обычно требуют меньше памяти во время обучения по сравнению с архитектурами, интенсивно использующими трансформеры. Введение оптимизатора MuSGD дополнительно стабилизирует процессы обучения, снижая вероятность расходящихся потерь или ошибок "NaN", которые могут преследовать экспериментальные модели. Пользователи могут легко начать обучение с помощью одной команды:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)

Случаи использования

Когда выбирать YOLOv10

YOLOv10 остается отличным выбором для академических исследователей, которые изучают теоретические пределы проектирования, ориентированного на эффективность и точность, или тех, кто желает развивать оригинальные исследования по двойному присваиванию. Низкое количество параметров в его версии 'nano' впечатляет для строго ограниченных теоретических бенчмарков.

Когда выбирать YOLO26

YOLO26 является рекомендуемым выбором для разработчиков, инженеров и предприятий, создающих реальные приложения.

  • Развертывание на периферии: Удаление DFL и оптимизация для инференса на CPU делают его идеальным для мобильных приложений и устройств IoT.
  • Сложные сценарии: Функция ProgLoss и STAL обеспечивают ощутимое преимущество в сценариях, связанных с мелкими объектами, таких как изображения с дронов или спутниковый анализ.
  • Требования к многозадачности: Проекты, которым в конечном итоге может потребоваться сегментация или оценка позы, могут оставаться в той же кодовой базе без смены библиотек.
  • Стабильность в производстве: Надежная поддержка экспорта для ONNX, TensorRT, CoreML и OpenVINO гарантирует, что модель, которую вы обучаете, является моделью, которую вы можете развернуть.

Заключение

В то время как YOLOv10 представил широкой публике захватывающую возможность обнаружения без NMS, YOLO26 усовершенствует и вводит в эксплуатацию эту технологию. Сочетая сквозной дизайн с передовыми оптимизаторами, вдохновленными LLM, универсальностью задач и надежной поддержкой платформы Ultralytics, YOLO26 выделяется как превосходный выбор для практической, высокопроизводительной разработки в области компьютерного зрения в 2026 году.

Для разработчиков, желающих изучить аналогичные передовые варианты, модель YOLO11 также предлагает отличную производительность и полностью поддерживается для устаревших рабочих процессов.


Комментарии