YOLO11 против YOLOv10: всестороннее техническое сравнение детекторов объектов реального времени

Ландшафт компьютерного зрения в реальном времени постоянно развивается, а новые архитектуры расширяют границы возможного как на периферийных устройствах, так и в облачной инфраструктуре. В этом подробном техническом анализе мы исследуем различия между двумя ключевыми моделями в этой области: Ultralytics YOLO11 и YOLOv10. Обе они представляют собой значительный скачок в возможностях обнаружения объектов, однако используют фундаментально разные архитектурные философии для достижения своих показателей производительности.

Разбор архитектуры YOLO11

Детали YOLO11:

Представленная как универсальный мощный инструмент, YOLO11 основывается на многолетних фундаментальных исследованиях в области компьютерного зрения и ИИ. Основная философия дизайна YOLO11 вращается вокруг богатства признаков и исключительной универсальности для выполнения множества задач компьютерного зрения.

Одним из выдающихся улучшений в YOLO11 является внедрение блока C3k2 Block. Этот усовершенствованный модуль «бутылочного горлышка» оптимизирует градиентный поток во всей сети, радикально улучшая эффективность параметров при сохранении высокой точности. Кроме того, YOLO11 использует улучшенный механизм пространственного внимания, который критически важен для идентификации мелких или частично перекрытых объектов. Это делает модель исключительным выбором для сценариев использования в аэрофотосъемке и детального анализа медицинских изображений.

YOLO11 использует архитектуру без анкоров (anchor-free), что сводит к минимуму сложность настройки гиперпараметров, обеспечивая надежную обобщающую способность на широком спектре пользовательских наборов данных. Более того, требования к памяти во время обучения значительно ниже по сравнению с архитектурами на базе Transformer, что позволяет исследователям эффективно обучать крупные модели на стандартном потребительском оборудовании.

Узнай больше о YOLO11

Изучение архитектуры YOLOv10

Подробности YOLOv10:

Разработанная исследователями из Университета Цинхуа, модель YOLOv10 произвела фурор как пионер end-to-end решений в семействе YOLO. Отличительной чертой YOLOv10 является методология NMS-Free Training. За счет использования согласованного двойного назначения на этапе обучения модель естественным образом предсказывает ровно одну ограничивающую рамку (bbox) на объект. Этот прорыв полностью устраняет необходимость в Non-Maximum Suppression (NMS) во время инференса — этапе постобработки, который исторически создавал задержки в конвейерах развертывания.

Архитектура также представляет комплексную стратегию проектирования «эффективность-точность». Она включает в себя пространственно-канальную связанную понижающую дискретизацию (downsampling) и рангово-ориентированные конструкции блоков, которые выборочно уменьшают избыточность на этапах сети. Это приводит к уменьшению количества FLOPs и снижению вычислительных затрат без существенной потери mean Average Precision (mAP). Для приложений реального времени, где важна каждая миллисекунда, исключение NMS обеспечивает детерминированный граф вывода, который отлично подходит для периферийных ИИ-устройств.

Узнать больше о YOLOv10

Метрики производительности и бенчмарки

При оценке этих двух моделей мы смотрим на баланс точности, количества параметров и скорости. Следующая таблица демонстрирует, как они соотносятся по различным масштабам на датасете COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Как показано в метриках производительности YOLO, YOLO11 обычно достигает немного более высоких показателей mAP во всех своих вариантах, особенно в более крупных моделях. Дизайн YOLOv10 без NMS обеспечивает очень стабильное время инференса end-to-end, но YOLO11 по-прежнему демонстрирует исключительную пропускную способность при оптимизации с помощью TensorRT на оборудовании NVIDIA.

Экспорт для продакшена

При подготовке моделей к развертыванию крайне важно выполнять экспорт в оптимизированные форматы. И YOLO11, и YOLOv10 могут быть легко экспортированы в такие форматы, как ONNX и TensorRT, с использованием фреймворка Ultralytics. Ознакомься с нашим руководством по вариантам развертывания моделей, чтобы получить пошаговые инструкции.

Преимущество экосистемы Ultralytics

Хотя отдельные метрики производительности важны, именно окружающий фреймворк определяет практический успех проекта машинного обучения. И именно здесь YOLO11, как родной участник экосистемы Ultralytics, по-настоящему сияет.

Платформа Ultralytics предлагает невероятно оптимизированный пользовательский опыт. С помощью простого и унифицированного Python API разработчики могут решать задачи, выходящие за рамки простых ограничивающих рамок. YOLO11 из коробки поддерживает нативную сегментацию экземпляров, оценку позы, классификацию изображений и обнаружение ориентированных ограничивающих рамок (OBB). Этой огромной универсальности часто не хватает в специализированных исследовательских репозиториях.

Кроме того, экосистема подкреплена обширной документацией и активной поддержкой сообщества. Интеграции с такими инструментами, как Weights & Biases для отслеживания экспериментов и OpenVINO для оптимизации под оборудование Intel, встроены непосредственно в библиотеку. Обучение модели требует минимум шаблонного кода и выигрывает от высокоэффективных процессов обучения, требующих меньше CUDA-памяти, чем тяжелые модели Transformer, такие как RT-DETR.

Практический пример кода

Обучение и выполнение инференса с помощью Ultralytics спроектированы так, чтобы быть максимально интуитивно понятными. Идентичный API легко обрабатывает как YOLO11, так и YOLOv10.

from ultralytics import YOLO

# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")

# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects
inference_results[0].show()

Варианты использования и рекомендации

Выбор между YOLO11 и YOLOv10 зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать YOLO11

YOLO11 — это отличный выбор для:

  • Развертывания на периферии (Edge): коммерческих приложений на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
  • Многозадачных приложений компьютерного зрения: проектов, требующих обнаружения, сегментации, оценки позы и OBB в рамках единого унифицированного фреймворка.
  • Быстрого прототипирования и развертывания: команд, которым необходимо быстро перейти от сбора данных к продакшену, используя оптимизированный Python API Ultralytics.

Когда выбирать YOLOv10

YOLOv10 рекомендуется для:

  • Обнаружение в реальном времени без NMS: Приложения, которые выигрывают от комплексного обнаружения без Non-Maximum Suppression, что снижает сложность развертывания.
  • Сбалансированные компромиссы скорости и точности: Проекты, требующие хорошего баланса между скоростью вывода и точностью обнаружения для моделей различных масштабов.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Следующее поколение: YOLO26

В то время как YOLOv10 представила революционную парадигму без NMS, а YOLO11 усовершенствовала многозадачную универсальность, область ИИ движется стремительно. Разработчикам, которые начинают новые производственные развертывания сегодня, мы настоятельно рекомендуем изучить Ultralytics YOLO26.

Выпущенная в январе 2026 года, YOLO26 объединяет лучшее из обоих миров. Она нативно использует дизайн End-to-End NMS-Free, впервые примененный в YOLOv10, радикально упрощая конвейер развертывания и обеспечивая стабильную задержку. Кроме того, YOLO26 включает специализированные оптимизации для периферийных вычислений. Выполняя удаление DFL (исключение Distribution Focal Loss), архитектура гарантирует более легкую экспортируемость и достигает до 43% более быстрого инференса на CPU по сравнению с устаревшими моделями, что делает её главным выбором для IoT-устройств с низким энергопотреблением и мобильных приложений.

YOLO26 также приносит стабильность обучения больших языковых моделей (LLM) в область компьютерного зрения с помощью инновационного оптимизатора MuSGD Optimizer, гибрида, вдохновленного передовыми исследованиями ИИ. В сочетании с функциями потерь ProgLoss + STAL, YOLO26 обеспечивает непревзойденную точность на мелких объектах, что необходимо для детального обнаружения на записях дорожного движения и сложной робототехники.

Узнай больше о YOLO26

Заключение

Выбор правильной модели зрения зависит от твоих конкретных операционных ограничений. YOLOv10 является важной вехой в академической среде, доказывая, что NMS можно эффективно исключить из конвейера обнаружения. Однако для превосходного баланса производительности, комплексной многозадачности и бесшовных инструментов развертывания, YOLO11 предлагает надежное, готовое к корпоративному использованию решение.

Инженерам, которые хотят получить абсолютно передовые технологии — сочетание простоты end-to-end с невероятно быстрой производительностью на периферии — настоятельно рекомендуется переход на последнюю версию YOLO26. Используя комплексную платформу Ultralytics, ты гарантируешь, что твои проекты строятся на хорошо поддерживаемом, высокоэффективном и перспективном фундаменте.

Комментарии