YOLOv10 YOLO26: новая эра сквозного обнаружения объектов

В последние годы в области обнаружения объектов в реальном времени произошли быстрые изменения, при этом особое внимание уделялось балансу между скоростью, точностью и простотой внедрения. В этом сравнении рассматриваются два важных этапа в этом процессе: YOLOv10, академический прорыв, который популяризировал обнаружение NMS, и YOLO26, новейшая готовая к производству мощная система от Ultralytics усовершенствует эти концепции для приложений корпоративного уровня.

Обзор модели

YOLOv10: академический пионер

Выпущенная в мае 2024 года исследователями из Университета Цинхуа, YOLOv10 радикальные изменения, устранив необходимость в использовании метода Non-Maximum Suppression (NMS) во время вывода. Этот «сквозной» подход решил давнюю проблему в процессе развертывания, когда задержка постобработки часто варьировалась непредсказуемо в зависимости от плотности сцены.

Авторы: Ao Wang, Hui Chen, Lihao Liu, и др.
Организация:Университет Цинхуа
Дата: 2024-05-23
Arxiv:arXiv:2405.14458
GitHub:THU-MIG/yolov10

Узнайте больше о YOLOv10

YOLO26: промышленный стандарт

Основанная на фундаменте, заложенном ее предшественниками, YOLO26 (выпущена в январе 2026 года) — это передовое решение Ultralytics, разработанное для реального воздействия. В ней используется сквозной дизайн NMS, впервые примененный в YOLOv10 усовершенствованный за счет более простых функций потери, нового оптимизатора и значительного повышения скорости на периферийном оборудовании.

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2026-01-14
GitHub:ultralytics/ultralytics

Узнайте больше о YOLO26

Техническое сравнение

Обе модели направлены на решение проблем задержки, вызванных NMS, но они используют разные подходы к оптимизации. YOLOv10 большое внимание архитектурному поиску и двойным назначениям для обучения, в то время как YOLO26 ставит во главу угла простоту развертывания, CPU и стабильность обучения.

Архитектура и Дизайн

YOLOv10 ввел метод Consistent Dual Assignments для обучения NMS. Этот метод сочетает в себе головку «один ко многим» (для тщательного контроля во время обучения) с головкой «один к одному» (для вывода), обеспечивая, чтобы модель научилась выводить один лучший прямоугольник для каждого объекта. Он также использовал целостный подход к проектированию модели, ориентированный на эффективность и точность, включая легкие классификационные головки и пространственно-канальное декуплированное понижающее дискретизирование.

YOLO26 усовершенствует эту технологию, полностью устраняя Distribution Focal Loss (DFL). Хотя DFL помогал с точностью определения границ в ранних версиях, его удаление значительно упрощает экспортный график, что делает модели YOLO26 более простыми для запуска на ограниченных по мощности устройствах и микроконтроллерах с низким энергопотреблением. Кроме того, YOLO26 включает в себя MuSGD Optimizer, гибрид SGD оптимизатора Muon (вдохновленный обучением LLM), который впервые обеспечивает стабильность обучения большими партиями для задач компьютерного зрения.

Метрики производительности

В следующей таблице показаны различия в производительности. YOLO26 демонстрирует превосходную скорость на ЦП и более высокую точность во всех масштабах модели, особенно в более крупных вариантах.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Прорыв в области CPU

YOLO26 специально оптимизирован для сред без выделенных графических процессоров. Он обеспечивает до 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его революционным решением для Raspberry Pi и мобильных устройств.

Варианты использования и реальные применения

Когда выбирать YOLOv10

YOLOv10 отличным выбором для исследователей и конкретных сценариев, связанных исключительно с обнаружением.

Академические исследования: Стратегия двойного назначения является интересной темой для дальнейшего изучения в области проектирования функций потерь.
Устаревшие конвейеры NMS: если проект уже был построен на основеONNX YOLOv10 ONNX , он продолжает обеспечивать надежное обнаружение с низкой задержкой.

Почему YOLO26 — лучший выбор для производства

Для большинства разработчиков YOLO26 предлагает более надежное и универсальное решение.

Edge Computing & IoT: Упрощенные функции потерь и удаление DFL делают YOLO26 идеальным решением для развертывания на периферийных устройствах, где память и вычислительные ресурсы ограничены.
Обнаружение мелких объектов: благодаря ProgLoss + STAL (Soft-Target Anchor Loss) YOLO26 отлично справляется с обнаружением мелких объектов, что является важным требованием для аэрофотосъемки и инспектирования с помощью дронов.
Комплексная многозадачность: в отличие от YOLOv10, который в основном является моделью обнаружения, YOLO26 изначально поддерживает задачи сегментации экземпляров, оценки позы и ориентированных ограничивающих прямоугольников (OBB) в рамках одной и той же структуры.

Преимущество Ultralytics

Выбор Ultralytics , такой как YOLO26, дает преимущества, которые выходят далеко за рамки сырых метрик. Интегрированная экосистема гарантирует поддержку вашего проекта от сбора данных до окончательного развертывания.

Оптимизированный пользовательский опыт

Простота использования, обеспечиваемаяPython Ultralytics , не имеет себе равных. В то время как другие репозитории могут требовать сложных скриптов настройки, Ultralytics можно загружать, обучать и развертывать с минимальным количеством кода.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

Комплексная поддержка экосистемы

YOLO26 полностью интегрирован в Ultralytics , что обеспечивает беспроблемное управление наборами данных, удаленное обучение и экспорт в форматы TensorRT, CoreML и OpenVINO одним щелчком мыши. Эта хорошо поддерживаемая экосистема гарантирует вам доступ к частым обновлениям, активному форуму сообщества и обширной документации для устранения любых проблем.

Эффективность обучения и память

Ultralytics славятся своей эффективностью обучения. Использование оптимизатора MuSGD в YOLO26 позволяет обеспечить стабильное обучение с меньшими требованиями к памяти по сравнению с моделями на основе трансформаторов, такими как RT-DETR. Это означает, что вы можете обучать высокоточные модели на потребительских графических процессорах без исчерпания VRAM, что делает доступ к высокопроизводительным возможностям искусственного интеллекта более демократичным.

Заключение

Обе архитектуры представляют собой значительные достижения в области компьютерного зрения. YOLOv10 заслуживает признания за популяризацию подхода NMS, доказав, что сквозное обнаружение применимо для приложений, работающих в режиме реального времени.

Однако YOLO26 берет эту концепцию и дорабатывает ее с учетом практических потребностей 2026 года. Благодаря превосходной CPU , специализированной поддержке небольших объектов с помощью ProgLoss и поддержке Ultralytics , YOLO26 является рекомендуемым выбором для разработчиков, стремящихся создать масштабируемые, перспективные решения в области искусственного интеллекта. Независимо от того, занимаетесь ли вы аналитикой в сфере умной розничной торговли, автономной робототехникой или высокоскоростным производством, YOLO26 обеспечивает баланс производительности, необходимый для успеха.

Другие модели для изучения

YOLO11: Надежный предшественник YOLO26, который по-прежнему широко используется в производстве.
RT-DETR: альтернативный вариант на основе трансформатора, обеспечивающий высокую точность в сценариях с большим количеством GPU .
YOLO: Идеально подходит для задач обнаружения с открытым словарем, где классы определяются текстовыми подсказками.