Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 против YOLO26#

В последние годы ландшафт компьютерного зрения претерпел значительные изменения: переход от сложных архитектур с тяжелой постобработкой к оптимизированным моделям полного цикла (end-to-end). Этот технический обзор посвящен двум важным этапам развития: академическому прорыву YOLOv10 и передовой, готовой к промышленному внедрению модели YOLO26. Изучив их архитектуры, методологии обучения и возможности развертывания в реальных условиях, ты сможешь принять взвешенное решение при создании своего следующего приложения в области ИИ для машинного зрения.

Link to this sectionYOLOv10: Пионер в области end-to-end детекции объектов#

Авторы: Ao Wang, Hui Chen, Lihao Liu и др. Организация: Tsinghua University Дата: 2024-05-23 Ссылки: arXiv Paper | GitHub Repository

Выпущенная в середине 2024 года, модель YOLOv10 стала значительным шагом вперед в академических исследованиях компьютерного зрения, решив одну из самых упорных проблем в детекции объектов в реальном времени: Non-Maximum Suppression (NMS). Традиционные детекторы сильно зависели от NMS для фильтрации избыточных ограничивающих рамок, что добавляло переменную задержку во время инференса и усложняло развертывание на периферийных устройствах.

Команда из Университета Цинхуа представила стратегию согласованного двойного назначения для обучения без использования NMS. Это позволило модели точно предсказывать ограничивающие рамки без этапа постобработки, что напрямую улучшило задержку инференса и снизило порог входа для развертывания на аппаратных ускорителях. Несмотря на высокую эффективность для стандартных задач детекции, модель была сфокусирована преимущественно на предсказании рамок и не имела встроенной поддержки более сложных задач, таких как сегментация экземпляров или оценка позы.

Узнай больше о YOLOv10

Link to this sectionYOLO26: Новый стандарт для Edge и Cloud Vision AI#

Авторы: Glenn Jocher и Jing Qiu Организация: Ultralytics Дата: 2026-01-14 Ссылки: GitHub Repository | Ultralytics Platform

Опираясь на концепции работы без NMS, представленные ранее, недавно выпущенная YOLO26 олицетворяет вершину производительности и универсальности. Разработанная как для академических исследований, так и для промышленного применения, она обладает встроенным end-to-end дизайном без NMS, полностью исключая постобработку для более быстрого и простого развертывания на всех поддерживаемых аппаратных платформах.

YOLO26 предлагает ряд революционных архитектурных улучшений. Удаление Distribution Focal Loss (DFL) значительно упрощает процесс экспорта модели и повышает совместимость с маломощными периферийными устройствами. В сочетании с этими структурными изменениями YOLO26 обеспечивает до 43% более быстрый CPU-инференс, что делает её отличным выбором для IoT и робототехники, где GPU-ускорение может быть недоступно.

Более того, стабильность обучения и скорость сходимости были радикально улучшены благодаря использованию MuSGD Optimizer, гибрида SGD и Muon, вдохновленного методами обучения LLM. В сочетании с продвинутыми функциями потерь, такими как ProgLoss + STAL, YOLO26 демонстрирует заметные улучшения в распознавании мелких объектов. Она также включает специфические улучшения для разных задач, включая многомасштабное прототипирование для сегментации, Residual Log-Likelihood Estimation (RLE) для оценки позы и специализированную функцию потерь по углу для решения проблем с границами в детекции ориентированных ограничивающих рамок (OBB).

Узнай больше о YOLO26

Корпоративное развертывание

Для команд, стремящихся масштабировать свои рабочие процессы компьютерного зрения, Ultralytics Platform обеспечивает бесшовную интеграцию с YOLO26, предлагая интуитивно понятную разметку данных, автоматизированное обучение в облаке и возможности развертывания в один клик без необходимости в сложной MLOps-инфраструктуре.

Link to this sectionСравнение технической производительности#

При оценке этих моделей критически важно соблюдать баланс между точностью, размером модели и скоростью инференса. В таблице ниже показана производительность обеих семейств моделей в разных масштабах, оцененная на стандартном наборе данных COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Данные наглядно демонстрируют эволюционное преимущество новой архитектуры. YOLO26 достигает более высокого показателя mAP (mean Average Precision) во всех категориях размеров, сохраняя при этом весьма конкурентную скорость инференса. Удаление DFL в YOLO26 напрямую способствует исключительной производительности на CPU при использовании ONNX, метрике, с которой у предыдущих поколений часто возникали сложности.

Link to this sectionМетодологии обучения и экосистема#

Модель полезна ровно настолько, насколько полезна экосистема, поддерживающая её. Хотя YOLOv10 предоставила отличную академическую реализацию на базе PyTorch, она часто требует ручной настройки для задач, выходящих за рамки базовой детекции.

Напротив, YOLO26 полностью интегрирована в хорошо поддерживаемую экосистему Ultralytics. Это обеспечивает значительно меньшие требования к памяти во время обучения по сравнению с трансформерными моделями, такими как RT-DETR, позволяя исследователям тренировать современные нейросети на потребительском оборудовании. Простота использования не имеет аналогов: предлагается единый API, который автоматически обрабатывает аугментацию данных, настройку гиперпараметров и логирование.

Link to this sectionПример кода: Обучение YOLO26#

Для обучения универсальной и высокоточной модели требуется всего несколько строк кода на Python:

from ultralytics import YOLO

# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with automatic memory management
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
)

# Export natively to TensorRT without NMS complexities
model.export(format="engine")

Link to this sectionРеальные применения и варианты использования#

Выбор правильной архитектуры полностью зависит от ограничений при развертывании.

Link to this sectionВысокоскоростные периферийные вычисления#

Для приложений, требующих быстрого развертывания на микроконтроллерах, роботах или устаревших мобильных устройствах, преимущество YOLO26 в виде ускоренного на 43% CPU-инференса делает её окончательным выбором. Её архитектура без NMS и DFL легко конвертируется в такие форматы, как OpenVINO и TensorRT, что идеально подходит для аналитики видео в реальном времени в инфраструктурах «умного города».

Link to this sectionПродвинутое компьютерное зрение для многозадачных систем#

Хотя YOLOv10 превосходна в простой детекции ограничивающих рамок, проекты, требующие глубокого визуального понимания, должны полагаться на YOLO26. От сегментации экземпляров в медицинской визуализации до точной оценки позы в спортивной аналитике, YOLO26 предоставляет специфические для каждой задачи функции потерь, которые гарантируют превосходную точность в различных областях.

Альтернативные варианты

Если твой проект требует надежной детекции с открытым словарем, рассмотри YOLO-World. Пользователям, поддерживающим устаревшие конвейеры, YOLO11 остается полностью поддерживаемой и мощной альтернативой в рамках экосистемы Ultralytics.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOv10 и YOLO26 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в выборе экосистемы.

Link to this sectionКогда стоит выбрать YOLOv10#

YOLOv10 — отличный выбор для:

  • Детекции в реальном времени без NMS: Приложения, которым полезна сквозная (end-to-end) детекция без использования Non-Maximum Suppression, что снижает сложность развертывания.
  • Сбалансированного соотношения скорости и точности: Проекты, требующие оптимального баланса между скоростью вывода и точностью детекции для различных масштабов моделей.
  • Приложений с постоянной задержкой: Сценарии развертывания, где критически важна предсказуемость времени вывода, например, в робототехнике или автономных системах.

Link to this sectionКогда стоит выбрать YOLO26#

YOLO26 рекомендуется для:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionЗаключение#

Переход от YOLOv10 к YOLO26 подчеркивает важный сдвиг от академического подтверждения концепции к готовым к производству корпоративным решениям. Используя новаторский дизайн без NMS и дополняя его оптимизатором MuSGD, ProgLoss и улучшенной совместимостью с периферийными устройствами, YOLO26 устанавливает новый стандарт того, что возможно в компьютерном зрении в реальном времени. Для разработчиков, стремящихся достичь наилучшего баланса скорости, точности и удобства использования, YOLO26 является главной рекомендацией.

Контрибьюторы

Комментарии