YOLO26 vs YOLO11: поколенческий скачок в Vision AI
При создании современных систем компьютерного зрения выбор правильной модели критически важен для достижения баланса между точностью, задержкой и эффективностью использования ресурсов. В быстро развивающейся сфере искусственного интеллекта Ultralytics продолжает расширять границы возможного. Этот подробный технический обзор рассматривает переход от весьма успешной модели YOLO11 к революционной новой YOLO26, предоставляя инженерам и исследователям в области ИИ информацию, необходимую для принятия обоснованных архитектурных решений.
Происхождение моделей и метаданные
Обе модели разработаны Ultralytics, однако они представляют разные парадигмы в истории развития детектирования объектов и многозадачных моделей компьютерного зрения.
Детали YOLO26:
- Авторы: Гленн Джочер (Glenn Jocher) и Цзин Цю (Jing Qiu)
- Организация: Ultralytics
- Дата: 2026-01-14
- GitHub: Репозиторий Ultralytics
- Документация: Официальная документация YOLO26
Детали YOLO11:
- Авторы: Гленн Джочер (Glenn Jocher) и Цзин Цю (Jing Qiu)
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: Репозиторий Ultralytics
- Документация: Официальная документация YOLO11
Архитектурные различия и инновации
Переход от YOLO11 к YOLO26 предполагает фундаментальные сдвиги как в архитектуре модели, так и в лежащем в основе процессе обучения. В то время как YOLO11 создала надежную базу для детектирования объектов и многозадачного обучения, YOLO26 полностью перерабатывает конвейер развертывания для периферийных вычислений.
Сквозной дизайн без NMS
Одним из наиболее значимых обновлений в YOLO26 является ее полностью сквозная архитектура. В отличие от YOLO11, которая полагается на постобработку Non-Maximum Suppression (NMS) для фильтрации перекрывающихся ограничивающих рамок, YOLO26 полностью исключает этот шаг. Эта концепция, впервые внедренная в YOLOv10, радикально снижает вариативность задержек и упрощает логику развертывания на различных периферийных устройствах.
Удаление DFL для эффективности на периферии
YOLO11 использует Distribution Focal Loss (DFL) для уточнения оценок ограничивающих рамок. Однако DFL опирается на сложные операции softmax, которые часто плохо поддерживаются маломощными периферийными ускорителями. YOLO26 успешно удаляет DFL без потери точности. Такое упрощение архитектуры приводит к значительно улучшенной совместимости с встроенными системами и позволяет YOLO26 достигать до 43% более быстрого вывода на CPU по сравнению с предыдущей версией.
Оптимизатор MuSGD
Стабильность и скорость обучения имеют первостепенное значение. YOLO26 представляет MuSGD Optimizer, гибрид Stochastic Gradient Descent (SGD) и Muon, во многом вдохновленный инновациями в обучении LLM от Moonshot AI Kimi K2. Этот оптимизатор привносит стабильность обучения языковых моделей в компьютерное зрение, обеспечивая более быструю сходимость и уменьшая потребление памяти во время обучения по сравнению с тяжелыми альтернативами на базе Transformer.
ProgLoss и STAL
Для исследователей, работающих с аэрофотоснимками или задачами на дронах, детектирование мелких объектов является давней проблемой. YOLO26 внедряет ProgLoss в сочетании с STAL (Scale-Targeted Attention Loss), обеспечивая заметные улучшения в распознавании мелких объектов по сравнению с YOLO11.
Сравнение производительности и метрик
При прямое сравнении моделей YOLO26 демонстрирует явное превосходство в точности и эффективности работы на периферийных устройствах, сохраняя при этом невероятно низкие требования к памяти, характерные для экосистемы Ultralytics.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Примечание: Модель YOLO26 nano (YOLO26n) демонстрирует улучшение скорости CPU примерно на 31% по сравнению с YOLO11n (38.9 мс против 56.1 мс), подчеркивая философию дизайна, ориентированную на периферийные вычисления.
Универсальность в задачах компьютерного зрения
Обе модели получают преимущества от постоянно поддерживаемой экосистемы Ultralytics, предлагая непревзойденную простоту использования через единый Python API. Это не просто детекторы объектов; это мощные многозадачные инструменты. Тем не менее, YOLO26 включает несколько специфических для задач улучшений:
- Сегментация экземпляров: YOLO26 использует улучшенную функцию потерь для семантической сегментации и многомасштабное прототипирование, создавая более четкие границы масок, чем YOLO11. Узнай больше о рабочих процессах сегментации.
- Оценка позы: Интегрируя Residual Log-Likelihood Estimation (RLE), YOLO26 значительно повышает точность ключевых точек в сложных позах человека. Открой для себя возможности оценки позы.
- Ориентированные ограничивающие рамки (OBB): Специализированная функция угловых потерь решает исторические проблемы прерывистости границ, делая YOLO26 исключительно надежной для детектирования повернутых объектов на спутниковых снимках. Прочитай о задачах OBB.
- Классификация изображений: Обе модели эффективно справляются с высокоскоростной классификацией, при этом YOLO26 обеспечивает небольшое улучшение точности top-1 на ImageNet.
Пример кода для обучения и вывода
Ultralytics славится своим вниманием к опыту разработчиков. Обучение современной модели или запуск скрипта вывода занимает всего несколько строк кода, что минимизирует шаблонный код и максимизирует продуктивность. Кроме того, обучение моделей YOLO требует значительно меньше CUDA памяти, чем крупные сети на базе Transformer.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()Идеальные сценарии использования и стратегии развертывания
Выбор между YOLO26 и YOLO11 полностью зависит от ограничений твоей производственной среды.
Когда использовать YOLO26
YOLO26 — это оптимальный выбор для современных, новых проектов. Она создана специально для:
- Периферийных вычислений и IoT: Потрясающая производительность CPU и удаление DFL делают ее королем устройств, таких как Raspberry Pi, Coral NPU и мобильных процессоров.
- Аналитики на дронах и авиационной аналитики: Интеграция ProgLoss + STAL делает ее уникально способной отслеживать крошечные, быстро движущиеся объекты на обширных ландшафтах.
- Приложений с критической задержкой: В автономной робототехнике или контроле качества на производстве дизайн без NMS обеспечивает детерминированную задержку без неожиданных скачков во время постобработки.
Когда стоит сохранить YOLO11
Несмотря на то, что YOLO26 превосходит ее, YOLO11 остается невероятно мощной моделью. Ты можешь остановиться на YOLO11, если:
- Устаревшие конвейеры: Твоя существующая инфраструктура развертывания на C++ тесно связана с конкретными анкерными выходами и логикой NMS старых архитектур.
- Академические стандарты: Ты публикуешь исследование и нуждаешься в высоко признанном стандарте 2024 года, чтобы сравнивать свои новые алгоритмы.
Мощь экосистемы Ultralytics
Независимо от того, развертываешь ли ты YOLO11 или YOLO26, использование моделей Ultralytics означает доступ к хорошо поддерживаемой экосистеме с частыми обновлениями и огромной поддержкой сообщества.
Для корпоративных команд Ultralytics Platform предоставляет комплексное решение для разметки данных, обучения моделей и бесшовного развертывания в облаке. От экспорта обученных весов в CoreML или TensorRT до настройки параметров гиперпараметров — предоставляемые инструменты гарантируют, что твой жизненный цикл ИИ будет максимально оптимизирован.