YOLOv10 против YOLO26: Сравнительный анализ
В быстро развивающейся области обнаружения объектов в реальном времени разработчики и исследователи постоянно ищут оптимальный баланс между скоростью инференса, точностью и гибкостью развертывания. Двумя важными вехами на этом пути являются YOLOv10, разработанная Университетом Цинхуа, и последующая YOLO26, новейшая флагманская модель от Ultralytics.
Хотя обе модели поддерживают переход к сквозным архитектурам, они значительно различаются в реализации, поддержке экосистемы и целевых приложениях. Данный анализ рассматривает архитектурные изменения, метрики производительности и практические соображения при выборе между этими двумя мощными инструментами компьютерного зрения на базе ИИ.
Обзор модели
YOLOv10: Пионер сквозных решений
Выпущенная в мае 2024 года исследователями из Университета Цинхуа, YOLOv10 привлекла внимание благодаря внедрению последовательной стратегии двойного назначения для обучения без NMS. Эта архитектура была направлена на устранение этапа постобработки не-максимального подавления (NMS), который исторически являлся узким местом по задержке в предыдущих версиях YOLO.
- Авторы: Ao Wang, Hui Chen, Lihao Liu, и др.
- Организация:Университет Цинхуа
- Дата: 23 мая 2024 г.
- Ключевое нововведение: Последовательное двойное назначение для обучения без NMS и целостный дизайн модели, ориентированный на эффективность и точность.
YOLO26: Новый стандарт для периферийного ИИ
Выпущенная в январе 2026 года компанией Ultralytics, YOLO26 дорабатывает сквозную концепцию, впервые предложенную YOLOv10, но перестраивает фреймворк с акцентом на развертывание на периферийных устройствах, стабильность обучения и аппаратную совместимость. Она удаляет устаревшие компоненты, такие как Distribution Focal Loss (DFL), для упрощения экспортируемости и внедряет методы оптимизации, вдохновленные LLM.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 14 января 2026 года
- Ключевое нововведение: Удаление DFL, оптимизатор MuSGD (гибрид SGD/Muon) и нативная сквозная поддержка пяти задач компьютерного зрения.
Архитектурные различия
Переход от YOLOv10 к YOLO26 представляет собой переход от академических инноваций к надежности производственного уровня.
Сквозная архитектура и NMS
Обе модели преследуют цель устранения NMS. YOLOv10 представила концепцию двойного назначения меток—используя назначение «один-ко-многим» для полноценного обучения и назначение «один-к-одному» для инференса.
YOLO26 принимает этот нативный сквозной дизайн без NMS, но оптимизирует реализацию для обеспечения бесшовной интеграции с экосистемой Ultralytics. Генерируя предсказания напрямую без постобработки, обе модели уменьшают изменчивость задержки, что критически важно для приложений реального времени, таких как автономные транспортные средства и робототехника.
Функции потерь и оптимизация
Основное различие заключается в способе обучения моделей.
- YOLOv10 фокусируется на дизайне, ориентированном на архитектурную эффективность и точность, оптимизируя конкретные компоненты для снижения вычислительных затрат.
- YOLO26 представляет оптимизатор MuSGD, гибрид SGD и оптимизатора Muon (вдохновленного Kimi K2 от Moonshot AI). Это переносит методы оптимизации из обучения больших языковых моделей (LLM) в компьютерное зрение, что приводит к более быстрой сходимости и большей стабильности. Кроме того, YOLO26 использует ProgLoss и STAL (Small-Target-Aware Label Assignment), специально направленные на улучшение распознавания мелких объектов.
Простота и Экспортируемость
YOLO26 делает радикальный шаг, удаляя Distribution Focal Loss (DFL). Хотя DFL помогал с точностью ограничивающих рамок в предыдущих поколениях, он часто усложнял процесс экспорта в такие форматы, как ONNX или TensorRT, особенно для периферийных устройств. Его удаление в YOLO26 упрощает граф модели, делая ее до 43% быстрее при инференсе на CPU по сравнению с предшественниками, что делает ее высокоэффективной для периферийных вычислений.
Сравнение производительности
В следующей таблице представлены метрики производительности обеих моделей. В то время как YOLOv10 демонстрирует высокую производительность, YOLO26 показывает превосходную скорость, особенно в средах CPU, и повышенную точность в более крупных моделях.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Основные выводы
- Эффективность CPU: YOLO26 обеспечивает проверенную, высокооптимизированную скорость инференса на CPU, что критически важно для устройств без выделенных GPU, таких как Raspberry Pi или стандартные ноутбуки.
- Прирост точности: В целом, YOLO26 достигает более высоких показателей mAP, со значительными улучшениями в вариантах medium (m), large (l) и extra-large (x).
- Эффективность параметров: В то время как YOLOv10 стремится к низкому количеству параметров, YOLO26 оптимизирует FLOPs и архитектуру для обеспечения лучшего mAP на вычислительную единицу в реальных сценариях.
Экосистема и простота использования
При выборе модели для продакшена окружающая экосистема так же важна, как и сама архитектура.
Преимущество Ultralytics
YOLO26 выигрывает от зрелой экосистемы Ultralytics. Это включает:
- Унифицированный API: Последовательный интерфейс python и CLI для обучения, валидации и развертывания.
- Документация: Обширные руководства по интеграциям с такими инструментами, как Weights & Biases, Comet и Roboflow.
- Универсальность: В отличие от YOLOv10, которая в основном фокусируется на detect, YOLO26 нативно поддерживает сегментацию экземпляров, оценку позы, ориентированные ограничивающие рамки (obb) и классификацию в рамках одного фреймворка.
- Поддержка: Активная поддержка сообщества через GitHub, Discord и Форум сообщества Ultralytics.
Гибкость задач
Если ваш проект требует больше, чем просто ограничивающие рамки — например, понимание позы тела (Pose) или сегментацию нерегулярных объектов (Segmentation) — YOLO26 предлагает эти возможности готовыми к использованию с тем же простым API.
Эффективность обучения
Модели YOLO26 обычно требуют меньше памяти во время обучения по сравнению с архитектурами, интенсивно использующими трансформеры. Введение оптимизатора MuSGD дополнительно стабилизирует процессы обучения, снижая вероятность расходящихся потерь или ошибок "NaN", которые могут преследовать экспериментальные модели. Пользователи могут легко начать обучение с помощью одной команды:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)
Случаи использования
Когда выбирать YOLOv10
YOLOv10 остается отличным выбором для академических исследователей, которые изучают теоретические пределы проектирования, ориентированного на эффективность и точность, или тех, кто желает развивать оригинальные исследования по двойному присваиванию. Низкое количество параметров в его версии 'nano' впечатляет для строго ограниченных теоретических бенчмарков.
Когда выбирать YOLO26
YOLO26 является рекомендуемым выбором для разработчиков, инженеров и предприятий, создающих реальные приложения.
- Развертывание на периферии: Удаление DFL и оптимизация для инференса на CPU делают его идеальным для мобильных приложений и устройств IoT.
- Сложные сценарии: Функция ProgLoss и STAL обеспечивают ощутимое преимущество в сценариях, связанных с мелкими объектами, таких как изображения с дронов или спутниковый анализ.
- Требования к многозадачности: Проекты, которым в конечном итоге может потребоваться сегментация или оценка позы, могут оставаться в той же кодовой базе без смены библиотек.
- Стабильность в производстве: Надежная поддержка экспорта для ONNX, TensorRT, CoreML и OpenVINO гарантирует, что модель, которую вы обучаете, является моделью, которую вы можете развернуть.
Заключение
В то время как YOLOv10 представил широкой публике захватывающую возможность обнаружения без NMS, YOLO26 усовершенствует и вводит в эксплуатацию эту технологию. Сочетая сквозной дизайн с передовыми оптимизаторами, вдохновленными LLM, универсальностью задач и надежной поддержкой платформы Ultralytics, YOLO26 выделяется как превосходный выбор для практической, высокопроизводительной разработки в области компьютерного зрения в 2026 году.
Для разработчиков, желающих изучить аналогичные передовые варианты, модель YOLO11 также предлагает отличную производительность и полностью поддерживается для устаревших рабочих процессов.