Перейти к содержанию

YOLOv10 YOLO11: соединяя академические инновации и реальный мир

Эволюция обнаружения объектов в реальном времени ознаменовалась быстрым прогрессом в скорости, точности и архитектурной эффективности. Двумя ключевыми игроками в этой недавней истории являются YOLOv10 и YOLO11. Хотя обе модели расширяют границы возможного в области компьютерного зрения, они основаны на разных философиях проектирования и ориентированы на разные потребности сообщества искусственного интеллекта. В этом сравнении рассматриваются технические характеристики, архитектурные различия и практические применения обеих моделей, чтобы помочь разработчикам выбрать подходящий инструмент для своих конкретных требований.

YOLOv10: академический пионер в области сквозного обнаружения

Выпущенный в мае 2024 года исследователями из Университета Цинхуа, YOLOv10 внесла радикальные изменения в YOLO , сосредоточившись на стратегии обученияNMS. Исторически YOLO полагались на Non-Maximum Suppression (NMS) для фильтрации перекрывающихся ограничивающих рамок во время вывода. Несмотря на свою эффективность, NMS узкое место в задержке развертывания и усложняет процесс экспорта в такие форматы, как TensorRT или ONNX.

Ключевые архитектурные инновации

YOLOv10 эти проблемы с помощью стратегии двойного назначения во время обучения. Он использует головку «один ко многим» для тщательного контроля во время обучения и головку «один к одному» для вывода, что позволяет модели напрямую предсказывать один лучший прямоугольник для каждого объекта. Это устраняет необходимость в NMS , значительно сокращая задержку на периферийных устройствах.

Кроме того, YOLOv10 целостную модель, ориентированную на эффективность и точность. Она включает в себя легкие классификационные головки, пространственно-канальное декуплированное понижающее дискретизирование и ранжированный блок-дизайн, которые в совокупности снижают вычислительную избыточность.

Технические метаданные:

Узнайте больше о YOLOv10

Ultralytics YOLO11: усовершенствован для корпоративного масштаба

Выпущен в сентябре 2024 года, Ultralytics YOLO11 основан на надежной платформе YOLOv8 и YOLOv9. Сохраняя традиционный подход NMS(в отличие от нативного сквозного YOLOv10), YOLO11 особое внимание эффективности извлечения признаков и оптимизации параметров. Он разработан как «швейцарский армейский нож» компьютерного зрения, превосходящий не только в обнаружении, но и в широком спектре задач, включая сегментацию экземпляров, оценку позы, классификацию и обнаружение ориентированных ограничивающих рамок (OBB).

Усовершенствования в YOLO11

YOLO11 усовершенствованную архитектуру (C3k2), которая улучшает интеграцию функций в разных масштабах. Это позволяет модели более эффективно, чем ее предшественники, улавливать мелкие детали в сложных сценах, такие как небольшие объекты на аэрофотоснимках. Кроме того, ее интеграция в Ultralytics обеспечивает беспроблемную поддержку обучения, валидации и развертывания на различных аппаратных платформах, от NVIDIA до базовых процессоров.

Технические метаданные:

Узнайте больше о YOLO11

Сравнение производительности

При сравнении производительности очень важно не ограничиваться только mAP , а учитывать компромиссы между скоростью, размером модели (параметрами) и вычислительными затратами (FLOP).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Анализ данных

В то время как YOLOv10 может похвастаться меньшим количеством параметров в некоторых конфигурациях (например, в модели «M»), YOLO11 часто достигает более высоких mAP и конкурентоспособную или превосходную скорость вывода на графических процессорах T4, демонстрируя эффективность своей оптимизированной базовой архитектуры.

Идеальные варианты использования

Когда выбирать YOLOv10

YOLOv10 отличный выбор для исследовательских проектов или конкретных сценариев развертывания на периферии, где устранение NMS имеет решающее значение для сокращения задержки. Его сквозная архитектура упрощает конвейер экспорта для определенных встроенных систем, в которых сложно эффективно реализовать логику постобработки.

  • Встроенные системы: устройства с ограниченным количеством CPU для постобработки.
  • Академические исследования: изучение архитектур NMS и стратегий обучения с двойным назначением.
  • Приложения с критической задержкой: высокоскоростная робототехника, где важна каждая миллисекунда задержки вывода.

Когда стоит выбирать Ultralytics YOLO11

YOLO11 предпочтительное решение для производственных приложений, требующих баланса высокой точности, универсальности и простоты использования. Опираясь на Ultralytics , оно предлагает оптимизированный рабочий процесс от аннотирования данных до мониторинга моделей.

  • Решения для предприятий: крупномасштабные развертывания, требующие надежных, поддерживаемых кодовых баз и коммерческого лицензирования.
  • Сложные задачи зрительного восприятия: проекты, требующие оценки положения или сегментации наряду с обнаружением.
  • Облачное обучение: бесшовная интеграция с Ultralytics для управления наборами данных и выполнения обучающих циклов.
  • Универсальность: разработчики, которым нужен единый фреймворк для классификации, обнаружения и сегментации с помощью унифицированного API.

Преимущество экосистемы Ultralytics

Один из наиболее значимых отличительных признаков YOLO11 является окружающая экосистема. В то время как YOLOv10 впечатляющим академическим вкладом, YOLO11 от постоянных обновлений, обширной документации и тесной интеграции с такими инструментами, как Ultralytics .

  • Простота использования: простой Python позволяет обучить модель всего за несколько строк кода.
  • Эффективность использования памяти: Ultralytics оптимизированы для более низкого использования памяти во время обучения по сравнению со многими альтернативами на основе Transformer, что делает их доступными на графических процессорах потребительского уровня.
  • Широкая совместимость: экспортируйте свою YOLO11 в CoreML, OpenVINO, TensorRTи другие с помощью одной команды.
from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Взгляд в будущее: будущее с YOLO26

Хотя YOLOv10 YOLO11 важные вехи, эта область развивается очень быстро. Для разработчиков, стремящихся к абсолютному передовому уровню, YOLO26 (выпущенная в январе 2026 года) сочетает в себе лучшее из обоих миров.

YOLO26 использует сквозную архитектуруNMS, впервые примененную в YOLOv10 усовершенствованную с помощью фирменной оптимизации Ultralytics для корпоративного масштаба. Он отличается удалением DFL (Distribution Focal Loss) для упрощения экспорта и инновационным оптимизатором MuSGD для стабильной конвергенции обучения, вдохновленной LLM. Благодаря на 43 % более быстрой CPU по сравнению с предыдущими поколениями и улучшенным функциям потерь, таким как ProgLoss + STAL, YOLO26 является лучшим выбором для современных проектов в области компьютерного зрения.

Узнайте больше о YOLO26

Для пользователей, заинтересованных в других специализированных архитектурах, в документации также рассматриваются RT-DETR для обнаружения на основе трансформаторов и YOLO для задач с открытым словарем.


Комментарии