YOLO26 против YOLO11: новая эра комплексных решений для искусственного интеллекта в области зрения
Эволюция обнаружения объектов характеризовалась неустанным стремлением к повышению скорости, точности и эффективности. Двумя наиболее значимыми вехами на этом пути являются YOLO26 и YOLO11. Обе модели являются результатом инновационных исследований компании Ultralytics, они представляют разные поколения архитектурной философии. В этом сравнении подробно рассматриваются технические нюансы этих архитектур, что помогает разработчикам и исследователям выбрать подходящий инструмент для своих конкретных приложений компьютерного зрения.
Сравнение метрик производительности
В следующей таблице показаны различия в производительности двух семейств моделей на COCO . Обратите внимание на значительный скачок в скорости CPU для YOLO26, который является прямым результатом оптимизации его архитектуры.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Архитектурная эволюция
YOLO26: революция NMS
Выпущенная в январе 2026 года, YOLO26 представляет собой сдвиг парадигмы в сторону нативного сквозного обнаружения объектов. В отличие от традиционных детекторов, которые полагаются на эвристические этапы постобработки, такие как Non-Maximum Suppression (NMS), для фильтрации дублирующихся ограничительных рамок, YOLO26 включает эту логику непосредственно в архитектуру сети. Эта концепция, первоначально разработанная в таких исследованиях, как YOLOv10, была усовершенствована для обеспечения стабильности производства в YOLO26.
Ключевые архитектурные инновации включают:
- Комплексная конструкция NMS: благодаря устранению NMS, YOLO26 упрощает процесс развертывания. Это особенно выгодно для сценариев пограничных вычислений, где изменчивость NMS может вызывать джиттер в приложениях реального времени.
- Удаление DFL: удаление Distribution Focal Loss (DFL) оптимизирует выходные слои модели. Это изменение значительно повышает совместимость с устройствами с низким энергопотреблением и упрощает экспорт модели в такие форматы, как ONNX CoreML, поскольку требуется меньше настраиваемых операторов.
- Оптимизатор MuSGD: Вдохновленный инновациями в области обучения больших языковых моделей (LLM), такими как Kimi K2 от Moonshot AI, YOLO26 использует гибридный оптимизатор, сочетающий SGD Muon. Это обеспечивает превосходную стабильность при обучении, позволяя быстрее достигать сходимости даже при работе со сложными наборами данных.
- ProgLoss + STAL: Внедрение функций Progressive Loss (ProgLoss) и Self-Training Anchor Loss (STAL) обеспечивает заметные улучшения в обнаружении небольших объектов. Эти функции потери динамически регулируют фокус во время обучения, обеспечивая более эффективное изучение сложных примеров, часто представляющих собой небольшие или закрытые объекты.
Почему CPU имеет значение
В таблице выше показано, что YOLO26n достигает 38,9 мс на CPU с 56,1 мс для YOLO11n. Это увеличение скорости CPU на CPU на 43 % открывает возможности для аналитики в реальном времени на потребительском оборудовании, снижая потребность в дорогих специализированных GPU в розничной торговле и IoT-развертываниях.
YOLO11: надежный стандарт
YOLO11, выпущенная в сентябре 2024 года, основана на наследии YOLOv8 включает в себя блок C3k2 и усовершенствования модуля SPPF (Spatial Pyramid Pooling - Fast). Несмотря на то, что она остается высокопроизводительной и надежной моделью, она по-прежнему использует традиционную систему обнаружения без анкеров, которая требует NMS .
YOLO11 другие модели в сценариях, где требуется обширная поддержка устаревших версий или где необходимо учитывать специфические особенности архитектуры предыдущих поколений. Однако по сравнению с оптимизированной архитектурой YOLO26, она несет немного большую вычислительную нагрузку на этапе постобработки, что может стать узким местом в средах с высокой пропускной способностью.
Идеальные варианты использования
Когда выбирать YOLO26
YOLO26 является рекомендуемым выбором практически для всех новых проектов, особенно для тех, в которых приоритетными являются эффективность и простота развертывания.
- Edge AI и IoT: благодаря значительному CPU и конструкции NMS, YOLO26 идеально подходит для таких устройств, как Raspberry Pi или NVIDIA . Низкая вариативность задержки имеет решающее значение для робототехники, где для контуров управления требуется стабильная синхронизация.
- Сложные задачи зрительного восприятия: помимо обнаружения, YOLO26 предлагает усовершенствования для конкретных задач. Например, оценка остаточной логарифмической вероятности (RLE) значительно повышает точность оценки положения, а специализированные функции угловой потери улучшают точность ориентированной ограничивающей рамки (OBB) для аэрофотоснимков.
- Приложения с низким энергопотреблением: благодаря удалению DFL и оптимизированной архитектуре YOLO26 потребляет меньше энергии на каждый вывод, что продлевает срок службы батареи в мобильных приложениях.
Когда следует выбирать YOLO11
YOLO11 актуальным вариантом для:
- Устаревшие системы: если у вас есть существующий конвейер, сильно настроенный под конкретный формат вывода YOLO11, и вы не можете позволить себе потратить время инженеров на обновление логики постобработки (хотя переход на YOLO26 с Ultralytics обычно проходит без проблем).
- Базовые показатели: Исследователи часто используют широко распространенные модели, такие как YOLO11 YOLOv8 в качестве базовых для сравнения с новыми архитектурами.
Преимущество Ultralytics
Независимо от того, выберете ли вы YOLO26 или YOLO11, использование Ultralytics дает явные преимущества по сравнению с конкурирующими фреймворками.
Простота использования и универсальность
Ultralytics разработаны для обеспечения максимальной простоты использования. Один Python поддерживает обнаружение, сегментацию, классификацию и отслеживание. Такая универсальность позволяет инженерным командам переключаться между задачами без необходимости изучения новых кодовых баз.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimization automatically handled
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for simplified edge deployment
path = model.export(format="onnx")
Эффективность обучения и использование памяти
Обе модели оптимизированы для эффективности обучения, но оптимизатор MuSGD YOLO26 дополнительно стабилизирует этот процесс. В отличие от массивных моделей на основе трансформаторов, которые требуют значительного объема VRAM,YOLO Ultralytics YOLO часто можно точно настроить на графических процессорах потребительского уровня, что делает доступ к передовым технологиям искусственного интеллекта более демократичным.
Хорошо поддерживаемая экосистема
Ultralytics и библиотека с открытым исходным кодом гарантируют, что ваши проекты будут актуальны и в будущем. Благодаря частым обновлениям, обширной документации и инструментам для управления наборами данных и обучения в облаке, вы получаете поддержку со стороны надежного сообщества и активной команды разработчиков.
Метаданные модели
YOLO26
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- Документы:ultralytics
YOLO11
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Документация:https://docs.ultralytics.com/models/yolo11/
Изучите другие модели
Для пользователей, заинтересованных в изучении различных архитектур, Ultralytics поддерживает RT-DETR для обнаружения на основе трансформаторов и SAM для задач сегментации без предварительной подготовки.
Заключение
В то время как YOLO11 остается надежной и эффективной моделью, YOLO26 устанавливает новый стандарт эффективности и скорости. Его сквозная конструкция NMS в сочетании со значительной оптимизацией CPU и усовершенствованными функциями потери делают его лучшим выбором для современных приложений компьютерного зрения. Используя YOLO26, разработчики могут достичь более высокой точности и более быстрой производительности с меньшей сложностью, оставаясь в удобной Ultralytics .