Перейти к содержанию

YOLO11 YOLO26: эволюция обнаружения объектов в реальном времени

Ландшафт компьютерного зрения постоянно меняется, и каждая новая итерация модели расширяет границы скорости, точности и удобства использования. Двумя важными вехами на этом пути являются YOLO11 и революционная YOLO26. В то время как YOLO11 надежный стандарт для внедрения в предприятиях в конце 2024 года, YOLO26 представляет собой сдвиг парадигмы с ее нативной сквозной архитектурой и CPU дизайном.

В этом руководстве представлено всестороннее техническое сравнение, которое поможет разработчикам, исследователям и инженерам выбрать подходящий инструмент для конкретных задач в области компьютерного зрения.

Резюме: основные различия

Хотя обе модели построены на основополагающих принципах семейства YOLO You Only Look Once), они значительно различаются по своей архитектурной философии.

  • YOLO11: Создан для универсальности и интеграции в экосистему. Он основан на традиционных методах постобработки, таких как Non-Maximum Suppression (NMS), но предлагает высокостабильную и хорошо поддерживаемую структуру для широкого спектра задач.
  • YOLO26: Разработан для периферийных устройств и с учетом будущих требований. В нем реализована нативная сквозная архитектура NMS, что исключает сложные этапы постобработки. Он также оснащен инновационным оптимизатором MuSGD и специально разработан для CPU , что делает его на 43 % быстрее на таких устройствах, как Raspberry Pi.

Подробный анализ производительности

Разница в производительности между поколениями часто измеряется в миллисекундах и процентных пунктах средней точности (mAP). В таблице ниже показаны улучшения в скорости и точности. Обратите внимание на значительное сокращение времени CPU для YOLO26, что является важным показателем для развертывания искусственного интеллекта на периферии.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

YOLO11: универсальный стандарт

YOLO11
Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 27.09.2024
GitHub: Ultralytics

YOLO11 значительное усовершенствование YOLO , в котором основное внимание уделяется эффективности извлечения признаков. Он улучшил YOLOv8 благодаря оптимизации блока C3k2 и внедрению усовершенствований SPPF.

Преимущества:

  • Проверенная надежность: широко используется в промышленности, с обширными плагинами и поддержкой сообщества.
  • GPU : высокая эффективность на NVIDIA (T4, A100) с использованием TensorRT, что делает его отличным решением для облачного вывода.
  • Универсальность задач: высокая эффективность в области обнаружения, сегментации и оценки позы.

Слабые стороны:

  • NMS : требует постобработки с подавлением неактивных точек (Non-Maximum Suppression), что может привести к изменчивости задержки и усложнить процессы развертывания.
  • Более высокая производительность FLOP: немного более затратно с точки зрения вычислений, чем новейшие архитектуры.

Узнайте больше о YOLO11

YOLO26: инноватор, ориентированный на периферию

YOLO26
Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 14.01.2026
GitHub: Ultralytics

YOLO26 — это перспективная архитектура, в которой приоритетом является эффективность на стандартном оборудовании. Благодаря устранению необходимости в NMS оптимизации наборов CPU , она обеспечивает производительность в реальном времени на устройствах, которые ранее считались слишком медленными для современного ИИ.

Ключевые инновации:

  • Полная NMS: благодаря прямому прогнозированию соответствий «один к одному» YOLO26 устраняет NMS . Это CoreML упрощает экспорт в ONNX или CoreML .
  • Удаление DFL: удаление потока Distribution Focal Loss оптимизирует выходную головку, повышая совместимость с периферийными устройствами с низким энергопотреблением.
  • MuSGD Optimizer: вдохновленный методами обучения больших языковых моделей (LLM) (в частности, Kimi K2 от Moonshot AI), этот гибридный оптимизатор сочетает в себе SGD с Muon для более быстрой конвергенции и стабильности.
  • ProgLoss + STAL: новые функции потери улучшают обнаружение мелких объектов, что является важным требованием для аэрофотосъемки и робототехники.

Узнайте больше о YOLO26

Архитектурное Глубокое Погружение

Переход от YOLO11 YOLO26 — это не просто изменение количества параметров, это фундаментальное изменение в том, как модель обучается и делает прогнозы.

Методы обучения и эффективность

Одной из отличительных черт Ultralytics является эффективность обучения. Обе модели используют преимущества интегрированной Ultralytics , которая обеспечивает бесперебойное управление наборами данных и обучение в облаке.

Однако YOLO26 представляет оптимизатор MuSGD, который адаптирует обновления импульса для более эффективной обработки сложных ландшафтов потерь моделей зрения, чем стандартные AdamW SGD. Это приводит к более быстрой конвергенции моделей, что позволяет сэкономить ценные часы GPU и уменьшить углеродный след обучения.

Кроме того, YOLO26 использует улучшенные потери, специфичные для задачи:

  • Сегментация: Улучшенная семантическая сегментация потерь и многомасштабные прото-модули.
  • Поза: оценка остаточной логарифмической вероятности (RLE) для более точной локализации ключевых точек.
  • OBB: Специализированная потеря угла для устранения разрывов границ в задачах ориентированной ограничивающей коробки.

Требования к памяти

YOLO Ultralytics YOLO известны своим низким потреблением памяти по сравнению с архитектурами на основе трансформаторов, такими как RT-DETR или SAM .

Оптимизация памяти

YOLO11 YOLO26 разработаны для обучения на графических процессорах потребительского класса (например, NVIDIA 3060 или 4070). В отличие от массивных трансформаторных моделей, требующих 24 ГБ+ VRAM, эффективные YOLO часто можно точно настроить на устройствах с объемом VRAM всего 8 ГБ, используя соответствующие размеры пакетов.

Реальные примеры использования

Выбор между YOLO11 YOLO26 часто зависит от вашего аппаратного обеспечения и конкретных потребностей приложения.

Идеальные сценарии для YOLO11

  • Облачные API-сервисы: там, где доступны мощные графические процессоры и высокая пропускная способность (пакетная обработка) важнее, чем задержка при обработке отдельных изображений.
  • Устаревшие интеграции: системы, уже построенные на основе конвейеров NMS, в которых изменение логики постобработки невозможно.
  • Аналитика общего назначения: тепловое картирование розничной торговли или подсчет покупателей с использованием стандартных GPU .

Идеальные сценарии для YOLO26

  • IoT и периферийные устройства: выполнение обнаружения объектов на Raspberry Pi, NVIDIA Nano или мобильных телефонах. CPU на 43 % является здесь решающим фактором.
  • Робототехника: изменчивость задержки является фатальной для контуров управления. Конструкция NMS обеспечивает детерминированное время вывода, что имеет решающее значение для автономной навигации.
  • Аэрофотосъемка: функция ProgLoss значительно улучшает распознавание мелких объектов, что делает YOLO26 превосходным инструментом для анализа видеозаписей с дронов.
  • Встроенные системы: устройства с ограниченными вычислительными возможностями, которые не могут позволить себе накладные расходы на сортировку тысяч потенциальных ящиков во время NMS.

Реализация кода

Обе модели обладают той же простотой использования, которая характерна для Ultralytics . Для перехода с YOLO11 YOLO26 необходимо изменить только строку модели.

from ultralytics import YOLO

# Load the latest YOLO26 model (NMS-free, CPU optimized)
model = YOLO("yolo26n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Process results
for result in results:
    result.show()  # Display to screen
    result.save(filename="result.jpg")  # Save to disk

Этот унифицированный API позволяет разработчикам экспериментировать с различными архитектурами без необходимости переписывания всего кода.

Заключение

Обе архитектуры демонстрируют, почему Ultralytics лидером в области компьютерного зрения с открытым исходным кодом. YOLO11 предлагает зрелое, универсальное и GPU решение, идеально подходящее для корпоративных центров обработки данных. YOLO26, однако, представляет будущее пограничного искусственного интеллекта, обеспечивая невероятно быструю CPU и упрощенный сквозной конвейер, который устраняет традиционные узкие места.

Для большинства новых проектов, особенно тех, которые связаны с периферийным развертыванием, мобильными приложениями или робототехникой,YOLO26 является рекомендуемым выбором благодаря превосходному соотношению скорости и точности, а также современной архитектуре.

Другие модели для изучения

  • YOLOv10: пионер подхода NMS в YOLO .
  • RT-DETR: детектор на основе трансформатора, обеспечивающий высокую точность в ситуациях, когда скорость не является первостепенным фактором.
  • YOLOv8: высоконадежная классическая модель, которая по-прежнему широко используется благодаря обширной библиотеке ресурсов.

Комментарии