YOLO26 против YOLO11: Техническое сравнение для инженеров по компьютерному зрению
Ландшафт обнаружения объектов в реальном времени и компьютерного зрения продолжает стремительно развиваться. Ultralytics остается в авангарде этой эволюции, постоянно расширяя границы скорости, точности и простоты использования. Это техническое сравнение углубляется в архитектурные усовершенствования, метрики производительности и идеальные сценарии использования для YOLO26 и YOLO11, помогая разработчикам и исследователям в выборе оптимальной модели для их потребностей развертывания.
Краткое изложение
YOLO26, выпущенный в январе 2026 года, представляет собой новейшее достижение (SOTA) в семействе YOLO. Он представляет собой нативную сквозную (без NMS) архитектуру, оптимизированную для развертывания на периферийных устройствах и для производительности CPU. YOLO11, его предшественник, выпущенный в сентябре 2024 года, остается мощным и надежным вариантом, хотя YOLO26 превосходит его по скорости вывода, особенно на оборудовании без GPU, и по архитектурной простоте.
Для большинства новых проектов YOLO26 является рекомендуемым выбором благодаря превосходному компромиссу между скоростью и точностью, а также упрощенному конвейеру развертывания.
Архитектурная эволюция
Переход от YOLO11 к YOLO26 включает значительные структурные изменения, направленные на снижение задержки и сложности при сохранении высокой точности.
YOLO26: Оптимизированный и сквозной
YOLO26 знаменует собой смену парадигмы за счет принятия нативной сквозной архитектуры. В отличие от традиционных моделей YOLO, которые полагаются на Non-Maximum Suppression (NMS) для фильтрации перекрывающихся ограничивающих рамок, YOLO26 полностью исключает этот шаг. Этот прорыв, впервые реализованный в YOLOv10, упрощает конвейер развертывания и снижает задержку вывода, что делает его особенно выгодным для приложений реального времени.
Ключевые архитектурные инновации в YOLO26 включают:
- Удаление DFL: Модуль Distribution Focal Loss (DFL) был удален. Это упрощение повышает совместимость с периферийными устройствами и ускоряет экспорт в такие форматы, как ONNX и TensorRT, за счет удаления сложных математических операций, которые могут стать узким местом для маломощных процессоров.
- Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (LLM), YOLO26 использует гибридный оптимизатор, объединяющий SGD и Muon (из Kimi K2 от Moonshot AI). Это приводит к более стабильной динамике обучения и более быстрой сходимости.
- ProgLoss + STAL: Прогрессивное балансирование потерь (ProgLoss) и присвоение меток с учетом малых объектов (STAL) значительно улучшают производительность при работе с мелкими объектами, что является критически важным фактором для изображений с дронов и дистанционного зондирования.
YOLO11: Надежный предшественник
YOLO11 основан на блоке C3k2 и модулях SPPF (Spatial Pyramid Pooling - Fast) для обеспечения высокой эффективности. Он использует усовершенствованный блок C2PSA с механизмами внимания для улучшения извлечения признаков. Хотя он очень эффективен, его зависимость от постобработки NMS вносит небольшие вычислительные накладные расходы во время инференса по сравнению со сквозным подходом YOLO26.
Почему сквозной подход важен
Удаление NMS в YOLO26 означает, что выходные данные модели требуют меньше кода постобработки. Это снижает риск ошибок при развертывании и обеспечивает стабильную задержку, поскольку время инференса не колеблется в зависимости от количества обнаруженных объектов.
Ориентиры производительности
В следующей таблице показаны различия в производительности между двумя моделями на наборе данных COCO. YOLO26 демонстрирует явные преимущества как в точности (mAP), так и в скорости инференса на CPU.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Анализ метрик
- Скорость инференса на CPU: YOLO26n примерно на 43% быстрее на CPU по сравнению с YOLO11n (38.9 мс против 56.1 мс). Это делает YOLO26 превосходным выбором для развертывания на Raspberry Pi, мобильных устройствах и стандартных CPU.
- Точность (mAP): Во всех масштабах YOLO26 стабильно достигает более высокой средней точности (Mean Average Precision). Модель 'nano' демонстрирует значительный скачок с 39.5 до 40.9 mAP, предлагая лучшее качество detect при более высоких скоростях.
- Эффективность модели: YOLO26 обычно требует меньше параметров и FLOPs для лучшей производительности, что демонстрирует выигрыш в эффективности от архитектурного сокращения и удаления DFL-головы.
Обучение и оптимизация
Обе модели выигрывают от надежной экосистемы Ultralytics, что делает обучение доступным и эффективным.
- Простота использования: Обе модели, YOLO26 и YOLO11, используют один и тот же унифицированный Python API и интерфейс CLI. Переключение между ними так же просто, как изменение строки модели с
yolo11n.ptвyolo26n.pt. - Эффективность обучения: Оптимизатор MuSGD в YOLO26 помогает стабилизировать процесс обучения, потенциально сокращая количество эпох, необходимых для достижения сходимости. Это экономит вычислительные затраты и время, особенно для больших наборов данных, таких как ImageNet.
- Требования к памяти: Модели Ultralytics известны своим низким потреблением памяти по сравнению с альтернативами на основе трансформеров. YOLO26 дополнительно оптимизирует это, удаляя избыточные вычисления в голове модели, что позволяет использовать большие размеры пакетов на потребительских GPU.
Пример обучения
Вот как вы можете обучить новейшую модель YOLO26 с помощью пакета Ultralytics Python:
from ultralytics import YOLO
# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Универсальность задач и сценарии использования
Оба семейства моделей поддерживают широкий спектр задач компьютерного зрения, включая detect, segment, классификацию, оценку позы и обнаружение ориентированных объектов (obb).
Идеальные сценарии использования для YOLO26
- Граничные вычисления: Благодаря скорости CPU, увеличенной до 43%, YOLO26 идеально подходит для устройств IoT, умных камер и мобильных приложений, где ресурсы GPU недоступны.
- Обнаружение мелких объектов: Благодаря ProgLoss и STAL, YOLO26 превосходно справляется со сценариями, такими как воздушное наблюдение, контроль качества и медицинская визуализация, где обнаружение мельчайших деталей имеет решающее значение.
- Робототехника реального времени: Без NMS-дизайн обеспечивает детерминированную задержку, что критически важно для контуров управления в автономной навигации и роботизированных манипуляциях.
Идеальные сценарии использования для YOLO11
- Устаревшие системы: Для рабочих процессов, уже оптимизированных под архитектуры YOLO11, или где специфические конвейеры постобработки жестко закодированы вокруг выходов NMS, YOLO11 остается стабильным и поддерживаемым выбором.
- Инференс на GPU общего назначения: На мощных GPU центров обработки данных (таких как T4) YOLO11 демонстрирует конкурентоспособную производительность, что делает его подходящим для пакетной обработки на стороне сервера, где задержка CPU менее критична.
Экосистема и поддержка
Одним из самых сильных преимуществ использования моделей Ultralytics является окружающая экосистема. Обе модели, YOLO26 и YOLO11, полностью интегрированы в платформу Ultralytics, что обеспечивает бесшовное управление моделями, визуализацию и развертывание.
- Документация: Подробные руководства охватывают все: от аннотирования данных до экспорта моделей.
- Сообщество: Активное сообщество на GitHub и Discord гарантирует разработчикам доступ к поддержке и общим знаниям.
- Интеграции: Обе модели поддерживают простой экспорт в такие форматы, как ONNX, OpenVINO и TensorRT, что упрощает развертывание в различных аппаратных средах.
Заключение
Хотя YOLO11 остается высокопроизводительной моделью, YOLO26 представляет собой значительный шаг вперед в эффективности и архитектурной простоте. Ее сквозная архитектура, сниженная задержка CPU и повышенная точность на мелких объектах делают ее превосходным выбором для современных приложений компьютерного зрения. Независимо от того, развертываете ли вы модель на периферийных устройствах или обучаете в облаке, YOLO26 предлагает лучший баланс производительности и удобства использования на сегодняшний день.
Детали модели
YOLO26
Автор: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2026-01-14
GitHub | Документация
YOLO11
Автор: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub | Документация
Разработчики, ищущие другие варианты, могут также рассмотреть YOLOv10 для более ранних сквозных концепций или YOLO-World для задач обнаружения с открытым словарем.