YOLO YOLO26: техническое противостояние в области обнаружения объектов в реальном времени
Развитие компьютерного зрения было обусловлено постоянным стремлением к повышению эффективности, скорости и точности. Двумя известными представителями в этой области являютсяYOLO, разработанный Alibaba Group, и передовой YOLO26, последняя версия от Ultralytics. В то время какYOLO еще в 2022 годуYOLO значительные инновации в области поиска нейронных архитектур (NAS), YOLO26 в 2026 году переопределяет ландшафт благодаря сквозной конструкции NMS, адаптированной для развертывания на периферии и масштабируемости производства.
В данном руководстве представлен подробный технический анализ этих двух моделей с сравнением их архитектуры, показателей производительности и пригодности для реальных приложений.
YOLO: инновации в поиске нейронных архитектур
Разработанная DAMO Academy компании Alibaba, YOLO (Distillation-Enhanced Neural Architecture Search-based YOLO) фокусируется на автоматизации проектирования базовых структур обнаружения для максимальной производительности при определенных ограничениях по задержке.
Ключевые архитектурные особенности
YOLO несколькими передовыми технологиями:
- Поиск нейронной архитектуры (NAS): в отличие от вручную разработанных базовых структур (таких как CSPDarknet),YOLO MAE-NAS (метод автоматизации эффективного поиска нейронной архитектуры) для обнаружения оптимальных структур. В результате получается топология сети, специально настроенная для достижения компромисса между операциями с плавающей запятой (FLOP) и точностью.
- RepGFPN: конструкция с тяжелым «шеей», в которой используются обобщенные пирамидальные сети (GFPN) в сочетании с перепараметризацией. Это позволяет эффективно объединять признаки в разных масштабах, улучшая обнаружение объектов разного размера.
- ZeroHead: упрощенная головка обнаружения, которая снижает вычислительную нагрузку во время инференса.
- AlignedOTA: Стратегия динамического назначения меток, которая решает проблему рассогласования между задачами классификации и регрессии во время обучения.
Производительность и ограничения
YOLO значительным шагом вперед в 2022 году, превзойдя предыдущие версии, такие как YOLOv6 и YOLOv7 в определенных тестах. Однако его зависимость от сложных процессов обучения, в частности необходимость этапа дистилляции с использованием большой модели-учителя, может затруднять работу разработчикам, которым требуется быстрая итерация на пользовательских наборах данных. Кроме того, несмотря на мощность RepGFPN, он может быть требовательным к памяти по сравнению с оптимизированными современными архитектурами.
Подробности DAMO-YOLO:
- Авторы: Сяньчжэ Сюй, Ици Цзян, Вэйхуа Чэнь, Илунь Хуан, Юань Чжан и Сюю Сунь
- Организация: Alibaba Group
- Дата: 23.11.2022
- Архив: 2211.15444v2
- GitHub: YOLO
Ultralytics : революция в области комплексных решений для периферийных устройств
Выпущенная в январе 2026 года, Ultralytics основана на наследии YOLOv8 и YOLO11, вводя фундаментальные изменения в способе обработки результатов обнаружения. Он разработан не только для достижения высоких результатов в тестах, но и для практического, беспроблемного развертывания на всех устройствах, от облачных серверов до IoT-устройств с ограниченными ресурсами.
Прорывная архитектура
YOLO26 включает в себя несколько передовых усовершенствований, которые отличают его от традиционных детекторов на основе якорей или без якорей:
- Сквозной дизайн NMS: Возможно, самым значительным изменением является удаление функции подавления не максимальных пиков (NMS). Благодаря применению стратегии сопоставления «один к одному» во время обучения (впервые использованной в YOLOv10), модель напрямую выдает окончательные прогнозы. Это устраняет разброс задержек, вызванный NMS , которая часто является узким местом в сценах с большим количеством объектов.
- Оптимизатор MuSGD: Вдохновленный инновациями в области обучения больших языковых моделей (LLM), такими как Kimi K2 от Moonshot AI, YOLO26 использует гибридный оптимизатор, сочетающий SGD Muon. Это обеспечивает беспрецедентную стабильность обучения компьютерному зрению, что приводит к более быстрой конвергенции.
- Удаление DFL: благодаря удалению Distribution Focal Loss выходной слой упрощается. Это упрощает экспорт в такие форматы, как ONNX и TensorRT , что значительно улучшает совместимость с периферийными устройствами и микроконтроллерами с низким энергопотреблением.
- ProgLoss + STAL: интеграция Progressive Loss и Soft-Target Anchor Labeling (STAL) обеспечивает значительное улучшение в обнаружении небольших объектов, что является критически важным требованием для аэрофотосъемки и робототехники.
Превосходство в развертывании
YOLO26 разработан для обеспечения высокой скорости. Он обеспечивает на 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его идеальным выбором для приложений, работающих на Raspberry Pi, мобильных процессорах или ПК Intel .
Детали YOLO26:
- Авторы: Гленн Джочер и Цзин Цю
- Организация: Ultralytics
- Дата: 14.01.2026
- Документация: Документация YOLO26
- GitHub: ultralytics
Сравнительный анализ производительности
В следующей таблице сравниваются показателиYOLO YOLO26 для моделей разных размеров. YOLO26 демонстрирует превосходную эффективность, достигая сопоставимого или лучшего mAP значительно меньшей задержкой, особенно на CPU , где NMS дает наилучшие результаты.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Преимущество задержки
The CPU ONNX для YOLO26 подчеркивают огромное преимущество конструкции NMS. Благодаря устранению этапа постобработки YOLO26 обеспечивает детерминированное и стабильно низкое время вывода, что крайне важно для анализа видео в реальном времени.
Преимущество Ultralytics
В то время какYOLO интересные академические идеи в области архитектурного поиска, Ultralytics предоставляет комплексное решение, разработанное для современных рабочих процессов разработки.
1. Простота использования и экосистема.
Сложность обученияYOLO на основе дистилляции может стать препятствием для входа на рынок. В отличие от этого, Ultralytics опыт «от нуля до героя». Благодаря унифицированному Python разработчики могут загружать, обучать и развертывать модели за считанные минуты. Ultralytics еще больше упрощает этот процесс, предлагая облачное обучение, управление наборами данных и инструменты автоматической аннотации.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100)
2. Универсальность задач
YOLO в первую очередь архитектура для обнаружения объектов. Ultralytics , однако, представляет собой мощный многозадачный инструмент. Одна платформа поддерживает:
- Сегментация экземпляров: включая улучшения, специфичные для задачи, такие как потеря семантической сегментации.
- Оценка позы: использование оценки остаточной логарифмической вероятности (RLE) для высокоточных ключевых точек.
- OBB: Специализированная потеря угла для ориентированных ограничивающих прямоугольников, необходимая для анализа спутниковых изображений.
- Классификация: высокоскоростная классификация изображений.
3. Эффективность обучения и память
YOLO26 оптимизирован для аппаратного обеспечения потребительского класса. Такие технологии, как оптимизатор MuSGD, позволяют проводить стабильное обучение с большими размерами пакетов по сравнению с гибридными трансформаторами, требующими большого объема памяти, или более старыми архитектурами NAS. Эта демократизация обучения ИИ означает, что вам не нужен корпоративный кластер H100 для тонкой настройки современной модели.
Идеальные варианты использования
Выбор подходящей модели зависит от ваших конкретных ограничений, но для большинства производственных сценариев YOLO26 предлагает наилучшую окупаемость инвестиций.
- ВыберитеYOLO : Вы являетесь исследователем, специализирующимся на методологиях поиска нейронных архитектур, или у вас есть унаследованный конвейер, построенный на основе кодовой базы tinyvision.
- Выберите Ultralytics , если:
- Развертывание на периферии: вам необходимо работать на Raspberry Pi, мобильных устройствах или процессорах, где конструкция NMS обеспечивает значительное ускорение.
- Быстрое разработка: вам нужна модель, которую легко обучить, проверить и экспортировать в форматы, такие как CoreML TFLite сложной настройки.
- Сложные задачи зрительного восприятия: для вашего проекта требуется нечто большее, чем просто ограничительные рамки, например сегментирование объектов или отслеживание положения тела человека.
- Долгосрочное обслуживание: вам нужна модель, поддерживаемая активным сообществом, с частыми обновлениями и полной документацией.
Заключение
КакYOLO YOLO26 представляют собой важные вехи в области обнаружения объектов.YOLO потенциал автоматизированного поиска архитектуры, раздвинув границы возможного в 2022 году. Однако YOLO26 остается окончательным выбором для 2026 года и далее. Решив NMS , оптимизировав CPU на CPU и интегрировав передовые методы обучения, такие как MuSGD, Ultralytics модель, которая не только быстрее и точнее, но и значительно проще в использовании.
Для разработчиков, стремящихся создавать надежные и перспективные приложения компьютерного зрения, Ultralytics предоставляет инструменты, модели и поддержку, необходимые для достижения успеха.
Тем, кто заинтересован в изучении других высокопроизводительных архитектур, рекомендуем ознакомиться с YOLO11 для общего назначения или RT-DETR для приложений на основе трансформаторов.