Перейти к содержанию

YOLO11 YOLOv10: соединяя эволюцию и революцию в области обнаружения объектов в реальном времени

Ландшафт компьютерного зрения определяется быстрой итерацией и революционными скачками. YOLO11 и YOLOv10 представляют две различные философии в этой эволюции. В то время как YOLO11 устоявшуюся, надежную Ultralytics для максимальной универсальности и готовности к производству, YOLOv10 революционные концепции, такие как обучение NMS, которые с тех пор повлияли на более новые модели, такие как YOLO26.

В этом всестороннем сравнении рассматриваются архитектурные решения, показатели производительности и идеальные варианты использования обеих моделей, чтобы помочь разработчикам выбрать подходящий инструмент для своего следующего проекта в области компьютерного зрения.

Краткий обзор показателей эффективности

Обе модели обладают впечатляющими возможностями, но уделяют приоритетное внимание разным аспектам процесса вывода. В таблице ниже приведены основные показатели производительности на стандартных наборах данных.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Архитектурное Глубокое Погружение

YOLO11: универсальный мощный инструмент

YOLO11, выпущенный Ultralytics сентябре 2024 года, основан на результатах обширных реальных испытаний. Он использует усовершенствованную архитектуру backbone и neck, разработанную для обеспечения богатого набора функций, что позволяет ему превосходить другие системы не только в обнаружении объектов, но и в сложных последующих задачах, таких как сегментация экземпляров и оценка позы.

Ключевые архитектурные особенности включают:

  • Блок C3k2: усовершенствованная версия блока CSP, оптимизирующая поток градиента и эффективность параметров.
  • Улучшенное пространственное внимание: повышает способность модели фокусироваться на небольших или частично закрытых объектах, что является важным требованием для анализа аэрофотоснимков.
  • Конструкция без якорей: снижает сложность настройки гиперпараметров и улучшает обобщение по различным наборам данных.

Узнайте больше о YOLO11

YOLOv10: Пионер сквозных решений

YOLOv10, разработанный исследователями из Университета Цинхуа, попал в заголовки новостей благодаря устранению этапа постобработки Non-Maximum Suppression (NMS). Это изменение архитектуры устраняет давнюю проблему в процессе развертывания, когда NMS могла варьироваться непредсказуемо в зависимости от количества обнаруженных объектов.

Ключевые инновации включают:

  • ОбучениеNMS: Использование последовательных двойных заданий во время обучения позволяет модели точно предсказывать одно поле для каждого объекта, устраняя необходимость в NMS .
  • Комплексный дизайн, обеспечивающий эффективность и точность: архитектура включает в себя легкие классификационные головки и пространственно-канальное декуплированное понижающее дискретизирование для снижения вычислительных затрат.
  • Ранжированный блочный дизайн: оптимизирует этапы модели для уменьшения избыточности, снижая FLOP без потери точности.

Узнайте больше о YOLOv10

Экосистема и простота использования

Хотя сырые показатели важны, успех проекта часто зависит от опыта разработчиков.

Преимущество Ultralytics

YOLO11 неотъемлемой частью Ultralytics , предоставляя значительные преимущества для рабочих процессов предприятий и исследовательских организаций:

  1. Единый API: один и тот же Python поддерживает обнаружение, сегментацию, классификацию, OBB и оценку позы. Переключение задач так же просто, как смена файла модели.
  2. Интеграция платформы: беспрепятственное подключение к Ultralytics для управления наборами данных, визуализации тренировочных запусков и развертывания на периферийных устройствах.
  3. Гибкость экспорта: встроенная поддержка экспорта в ONNX, TensorRT, CoreML и OpenVINO эффективную работу вашей модели на любом оборудовании.

Оптимизированный рабочий процесс

Использование Ultralytics означает, что вы тратите меньше времени на написание шаблонного кода и больше времени на решение специфических задач. Для обучения современной модели достаточно нескольких строк кода.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with minimal configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

YOLOv10

YOLOv10 также YOLOv10 в Ultralytics , YOLOv10 позволяет пользователям использовать тот же удобный синтаксис. Однако, как академический вклад, он может не получать такие же частые обновления для конкретных задач (например, OBB или улучшения отслеживания) по сравнению с основными Ultralytics . Он служит отличным вариантом для чистых задач обнаружения, где архитектура NMS обеспечивает определенное преимущество по задержке.

Приложения в реальном мире

Выбор между этими моделями часто зависит от конкретных ограничений вашей среды развертывания.

Идеальные сценарии для YOLO11

Универсальность YOLO11 делает его предпочтительным выбором для сложных, многогранных приложений:

  • Умная розничная торговля: одновременное track (Pose) и мониторинг запасов на полках (Detection) для оптимизации планировки магазина и запасов.
  • Автономная робототехника: использование ориентированных ограничительных коробок (OBB) для помощи роботам в захвате объектов, которые не расположены идеально горизонтально.
  • Сельское хозяйство: Использование моделей сегментации для точной идентификации болезней растений на листьях, где простые ограничительные рамки были бы недостаточны.

Идеальные сценарии для YOLOv10

YOLOv10 в условиях, когда задержка постобработки является критическим препятствием:

  • Подсчет большого количества людей: в сценариях с сотнями объектов NMS работать медленно. Комплексная конструкция YOLOv10 обеспечивает стабильную скорость независимо от количества объектов.
  • Встроенные системы: для устройств с ограниченным количеством CPU для постобработки удаление NMS ценные ресурсы.

Заключение: какую модель вам следует выбрать?

YOLO11 остается самым надежным универсальным решением для большинства разработчиков. Благодаря балансу скорости, точности и поддержки множества задач машинного зрения, а также обширной Ultralytics , это решение является безопасным и мощным выбором для коммерческого использования.

YOLOv10 предлагает привлекательную альтернативу для определенных рабочих процессов, связанных исключительно с обнаружением, особенно в тех случаях, когда устранение NMS ощутимую выгоду в плане стабильности задержки.

Однако тем, кто ищет самые передовые технологии, мы рекомендуем ознакомиться с YOLO26. Выпущенная в январе 2026 года, YOLO26 эффективно объединяет лучшее из обоих миров: она использует сквозную конструкцию NMS, впервые примененную в YOLOv10 , сохраняя YOLOv10 богатство функций, универсальность задач и поддержку экосистемы YOLO11. Благодаря оптимизациям, таким как обучение MuSGD и удаление DFL, YOLO26 предлагает превосходную производительность как для периферийных, так и для облачных развертываний.

Узнайте больше о YOLO26

Другие модели для изучения

  • YOLO26: новейшая ультрасовременная модель от Ultralytics январь 2026 г.), отличающаяся архитектурой NMS и CPU .
  • YOLOv8: широко распространенный отраслевой стандарт, известный своей надежностью и широкой совместимостью.
  • RT-DETR: детектор на основе трансформатора, обеспечивающий высокую точность, идеально подходит для сценариев, в которых имеется достаточно GPU .
  • SAM : модель Meta Segment Anything, идеально подходящая для задач сегментации без обучения, когда данных для обучения мало.

Комментарии