YOLO11 YOLOv10: соединяя эволюцию и революцию в области обнаружения объектов в реальном времени
Ландшафт компьютерного зрения определяется быстрой итерацией и революционными скачками. YOLO11 и YOLOv10 представляют две различные философии в этой эволюции. В то время как YOLO11 устоявшуюся, надежную Ultralytics для максимальной универсальности и готовности к производству, YOLOv10 революционные концепции, такие как обучение NMS, которые с тех пор повлияли на более новые модели, такие как YOLO26.
В этом всестороннем сравнении рассматриваются архитектурные решения, показатели производительности и идеальные варианты использования обеих моделей, чтобы помочь разработчикам выбрать подходящий инструмент для своего следующего проекта в области компьютерного зрения.
Краткий обзор показателей эффективности
Обе модели обладают впечатляющими возможностями, но уделяют приоритетное внимание разным аспектам процесса вывода. В таблице ниже приведены основные показатели производительности на стандартных наборах данных.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Архитектурное Глубокое Погружение
YOLO11: универсальный мощный инструмент
YOLO11, выпущенный Ultralytics сентябре 2024 года, основан на результатах обширных реальных испытаний. Он использует усовершенствованную архитектуру backbone и neck, разработанную для обеспечения богатого набора функций, что позволяет ему превосходить другие системы не только в обнаружении объектов, но и в сложных последующих задачах, таких как сегментация экземпляров и оценка позы.
Ключевые архитектурные особенности включают:
- Блок C3k2: усовершенствованная версия блока CSP, оптимизирующая поток градиента и эффективность параметров.
- Улучшенное пространственное внимание: повышает способность модели фокусироваться на небольших или частично закрытых объектах, что является важным требованием для анализа аэрофотоснимков.
- Конструкция без якорей: снижает сложность настройки гиперпараметров и улучшает обобщение по различным наборам данных.
YOLOv10: Пионер сквозных решений
YOLOv10, разработанный исследователями из Университета Цинхуа, попал в заголовки новостей благодаря устранению этапа постобработки Non-Maximum Suppression (NMS). Это изменение архитектуры устраняет давнюю проблему в процессе развертывания, когда NMS могла варьироваться непредсказуемо в зависимости от количества обнаруженных объектов.
Ключевые инновации включают:
- ОбучениеNMS: Использование последовательных двойных заданий во время обучения позволяет модели точно предсказывать одно поле для каждого объекта, устраняя необходимость в NMS .
- Комплексный дизайн, обеспечивающий эффективность и точность: архитектура включает в себя легкие классификационные головки и пространственно-канальное декуплированное понижающее дискретизирование для снижения вычислительных затрат.
- Ранжированный блочный дизайн: оптимизирует этапы модели для уменьшения избыточности, снижая FLOP без потери точности.
Экосистема и простота использования
Хотя сырые показатели важны, успех проекта часто зависит от опыта разработчиков.
Преимущество Ultralytics
YOLO11 неотъемлемой частью Ultralytics , предоставляя значительные преимущества для рабочих процессов предприятий и исследовательских организаций:
- Единый API: один и тот же Python поддерживает обнаружение, сегментацию, классификацию, OBB и оценку позы. Переключение задач так же просто, как смена файла модели.
- Интеграция платформы: беспрепятственное подключение к Ultralytics для управления наборами данных, визуализации тренировочных запусков и развертывания на периферийных устройствах.
- Гибкость экспорта: встроенная поддержка экспорта в ONNX, TensorRT, CoreML и OpenVINO эффективную работу вашей модели на любом оборудовании.
Оптимизированный рабочий процесс
Использование Ultralytics означает, что вы тратите меньше времени на написание шаблонного кода и больше времени на решение специфических задач. Для обучения современной модели достаточно нескольких строк кода.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with minimal configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
YOLOv10
YOLOv10 также YOLOv10 в Ultralytics , YOLOv10 позволяет пользователям использовать тот же удобный синтаксис. Однако, как академический вклад, он может не получать такие же частые обновления для конкретных задач (например, OBB или улучшения отслеживания) по сравнению с основными Ultralytics . Он служит отличным вариантом для чистых задач обнаружения, где архитектура NMS обеспечивает определенное преимущество по задержке.
Приложения в реальном мире
Выбор между этими моделями часто зависит от конкретных ограничений вашей среды развертывания.
Идеальные сценарии для YOLO11
Универсальность YOLO11 делает его предпочтительным выбором для сложных, многогранных приложений:
- Умная розничная торговля: одновременное track (Pose) и мониторинг запасов на полках (Detection) для оптимизации планировки магазина и запасов.
- Автономная робототехника: использование ориентированных ограничительных коробок (OBB) для помощи роботам в захвате объектов, которые не расположены идеально горизонтально.
- Сельское хозяйство: Использование моделей сегментации для точной идентификации болезней растений на листьях, где простые ограничительные рамки были бы недостаточны.
Идеальные сценарии для YOLOv10
YOLOv10 в условиях, когда задержка постобработки является критическим препятствием:
- Подсчет большого количества людей: в сценариях с сотнями объектов NMS работать медленно. Комплексная конструкция YOLOv10 обеспечивает стабильную скорость независимо от количества объектов.
- Встроенные системы: для устройств с ограниченным количеством CPU для постобработки удаление NMS ценные ресурсы.
Заключение: какую модель вам следует выбрать?
YOLO11 остается самым надежным универсальным решением для большинства разработчиков. Благодаря балансу скорости, точности и поддержки множества задач машинного зрения, а также обширной Ultralytics , это решение является безопасным и мощным выбором для коммерческого использования.
YOLOv10 предлагает привлекательную альтернативу для определенных рабочих процессов, связанных исключительно с обнаружением, особенно в тех случаях, когда устранение NMS ощутимую выгоду в плане стабильности задержки.
Однако тем, кто ищет самые передовые технологии, мы рекомендуем ознакомиться с YOLO26. Выпущенная в январе 2026 года, YOLO26 эффективно объединяет лучшее из обоих миров: она использует сквозную конструкцию NMS, впервые примененную в YOLOv10 , сохраняя YOLOv10 богатство функций, универсальность задач и поддержку экосистемы YOLO11. Благодаря оптимизациям, таким как обучение MuSGD и удаление DFL, YOLO26 предлагает превосходную производительность как для периферийных, так и для облачных развертываний.
Другие модели для изучения
- YOLO26: новейшая ультрасовременная модель от Ultralytics январь 2026 г.), отличающаяся архитектурой NMS и CPU .
- YOLOv8: широко распространенный отраслевой стандарт, известный своей надежностью и широкой совместимостью.
- RT-DETR: детектор на основе трансформатора, обеспечивающий высокую точность, идеально подходит для сценариев, в которых имеется достаточно GPU .
- SAM : модель Meta Segment Anything, идеально подходящая для задач сегментации без обучения, когда данных для обучения мало.