Link to this sectionYOLOv10 против YOLO11#
Ландшафт компьютерного зрения постоянно меняется, и новые архитектуры расширяют границы того, что возможно в обработке в реальном времени. Разработчикам и исследователям, работающим в этой динамичной области, крайне важно понимать различия между передовыми моделями. В этом подробном сравнении мы исследуем технические отличия, компромиссы производительности и идеальные сценарии использования YOLOv10 и Ultralytics YOLO11 — двух высокоэффективных фреймворков для обнаружения объектов.
Хотя обе модели показывают впечатляющие результаты на эталонных наборах данных, их базовые подходы к проектированию и экосистемные интеграции существенно различаются. Изучив их архитектуры, ты сможешь определить, какое решение лучше всего соответствует твоим ограничениям при развертывании и целям проекта.
Link to this sectionYOLOv10: Пионер в области NMS-free end-to-end детектирования#
Выпущенная весной 2024 года, YOLOv10 представила новый подход к традиционному конвейеру обнаружения объектов, напрямую решая проблему задержек, связанных с постобработкой.
- Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
- Организация: Tsinghua University
- Дата: 23 мая 2024 г.
- Научная статья: arXiv:2405.14458
- Исходный код: THU-MIG/yolov10 на GitHub
- Документация: Документация YOLOv10
Главная инновация YOLOv10 — это стратегия согласованных двойных присвоений (consistent dual assignments), которая позволяет проводить обучение без использования NMS. Традиционные детекторы объектов сильно зависят от Non-Maximum Suppression (NMS) для фильтрации избыточных предсказаний ограничивающих рамок. Убрав этот шаг, YOLOv10 достигает полноценного end-to-end обнаружения, уменьшая задержку вывода и упрощая развертывание на аппаратных ускорителях, таких как Neural Processing Units (NPUs), где оптимизация пользовательских операций NMS зачастую крайне затруднена.
Link to this sectionYOLO11: Универсальность и производительность в рамках экосистемы#
Выпущенная позже в том же году, YOLO11 представляет собой результат непрерывного совершенствования семейства моделей Ultralytics, сфокусированный на оптимальном балансе скорости, точности и удобства для разработчика.
- Авторы: Glenn Jocher и Jing Qiu
- Организация: Ultralytics
- Дата: 27 сентября 2024 г.
- Исходный код: Ultralytics на GitHub
- Интеграция с платформой: Платформа Ultralytics
YOLO11 создана для продакшена. Хотя она отлично справляется со стандартным обнаружением объектов, ее настоящая сила заключается в универсальности. В отличие от YOLOv10, которая в основном сфокусирована на обнаружении объектов, YOLO11 нативно поддерживает задачи instance segmentation, pose estimation, image classification и Oriented Bounding Box (OBB), используя единую архитектуру. Она обладает удивительно низкими требованиями к памяти во время обучения, что делает её доступной для команд, работающих на потребительских GPUs, по сравнению с более тяжелыми архитектурами на основе Transformer.
Link to this sectionСравнение производительности и метрик#
При прямом сравнении этих моделей важно оценить, как они работают на различных масштабах на стандартных бенчмарках, таких как COCO dataset.
В таблице ниже показаны различия в производительности. YOLO11 часто превосходит YOLOv10 по показателю mAP в большинстве размерных категорий, сохраняя при этом очень конкурентоспособную скорость вывода TensorRT.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Чтобы воспроизвести эту высокую скорость вывода локально, убедись, что ты экспортируешь свои модели в оптимизированные форматы, такие как OpenVINO для Intel CPUs или TensorRT для NVIDIA GPUs.
Link to this sectionГлубокое изучение архитектуры#
Link to this sectionМетодология обучения и эффективность#
Архитектура YOLOv10 делает упор на снижение вычислительной избыточности. Оптимизируя дизайн бэкбона и неков с помощью комплексной стратегии эффективности и точности, авторы из Университета Цинхуа смогли значительно сократить количество параметров в моделях среднего уровня (например, YOLOv10m) по сравнению с предыдущими итерациями.
Однако эффективность обучения — это главная отличительная черта моделей Ultralytics. YOLO11 использует высокооптимизированный пакет ultralytics для Python, который берет на себя всю сложность hyperparameter tuning. Этот фреймворк автоматически обрабатывает продвинутую аугментацию данных, планирование скорости обучения и распределенное обучение на нескольких GPU «из коробки». Архитектура YOLO11 также демонстрирует отличный градиентный поток, что приводит к более быстрому сбору и меньшему потреблению VRAM во время обучения.
Link to this sectionПростота использования и преимущество экосистемы#
Критическим фактором для внедрения в корпоративной среде является хорошо поддерживаемая экосистема. Исследовательские репозитории, несмотря на свою новизну, часто становятся заброшенными после публикации научной статьи. Экосистема Ultralytics, стоящая за YOLO11, обеспечивает бесшовный опыт разработки от начала до конца.
Интегрируясь с такими инструментами, как Weights & Biases для отслеживания экспериментов и Roboflow для управления наборами данных, YOLO11 ускоряет путь от прототипа к продакшену. Простота использования очевидна в оптимизированном API, позволяющем тебе обучать и экспортировать модели всего несколькими строками кода.
from ultralytics import YOLO
# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")
# Export to ONNX format for deployment flexibility
model.export(format="onnx")Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOv10 и YOLO11 зависит от специфических требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда стоит выбрать YOLOv10#
YOLOv10 — отличный выбор для:
- Детекции в реальном времени без NMS: Приложения, которым полезна сквозная (end-to-end) детекция без использования Non-Maximum Suppression, что снижает сложность развертывания.
- Сбалансированного соотношения скорости и точности: Проекты, требующие оптимального баланса между скоростью вывода и точностью детекции для различных масштабов моделей.
- Приложений с постоянной задержкой: Сценарии развертывания, где критически важна предсказуемость времени вывода, например, в робототехнике или автономных системах.
Link to this sectionКогда выбирать YOLO11#
YOLO11 рекомендуется для:
- Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
- Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
- Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionИзучение других архитектур#
Хотя YOLOv10 и YOLO11 — отличный выбор, твой конкретный кейс может выиграть от использования других архитектур, доступных в документации. Для рассуждений на основе последовательностей, модели Transformer, такие как RT-DETR, обеспечивают высокую точность, хотя они обычно требуют больше ресурсов памяти. И наоборот, если тебе нужны возможности zero-shot для идентификации новых классов без дообучения, YOLO-World предлагает подход с открытым словарем, управляемый промптами на естественном языке.
Link to this sectionСледующее поколение: YOLO26#
Для команд, стремящихся к абсолютному уровню state-of-the-art, недавно выпущенная Ultralytics YOLO26 сочетает в себе лучшие характеристики обеих обсуждаемых выше моделей. Выпущенная в январе 2026 года, YOLO26 является оптимальной рекомендацией для современных сценариев развертывания.
Опираясь на фундамент своих предшественников, YOLO26 нативно включает End-to-End NMS-Free дизайн, эффективно устраняя узкие места постобработки, с которыми впервые справилась YOLOv10, но делает это в рамках надежной экосистемы Ultralytics. Кроме того, YOLO26 поддерживает удаление DFL (Distribution Focal Loss), что радикально упрощает графы экспорта модели и повышает совместимость с edge-устройствами и маломощными устройствами IoT.
Стабильность обучения также совершила качественный скачок с внедрением оптимизатора MuSGD — гибридного подхода, вдохновленного методологиями обучения LLM, который обеспечивает невероятно быструю сходимость. В сочетании с продвинутыми функциями потерь, такими как ProgLoss + STAL, YOLO26 обеспечивает заметные улучшения в распознавании мелких объектов. Для развертывания на стандартных edge-устройствах эти архитектурные улучшения приводят к ускорению вывода на CPU до 43%, что делает YOLO26 непревзойденным выбором для любых задач компьютерного зрения.