Link to this sectionYOLO11 против YOLOv10#
Ландшафт компьютерного зрения в реальном времени постоянно развивается, и новые архитектуры расширяют границы возможного как на граничных устройствах, так и в облачной инфраструктуре. В этом подробном техническом анализе мы исследуем различия между двумя ключевыми моделями в этой области: Ultralytics YOLO11 и YOLOv10. Обе они представляют собой значительный скачок в возможностях обнаружения объектов, однако для достижения производительности они используют принципиально разные архитектурные подходы.
Link to this sectionРазбор архитектуры YOLO11#
Детали YOLO11:
- Авторы: Гленн Джочер и Цзин Цю
- Организация: Ultralytics
- Дата: 27.09.2024
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Представленная как универсальное мощное решение, YOLO11 основывается на многолетних фундаментальных исследованиях в области компьютерного зрения и ИИ. Основная философия дизайна YOLO11 вращается вокруг богатства функций и экстремальной универсальности для выполнения множества задач компьютерного зрения.
Одним из заметных улучшений в YOLO11 является внедрение блока C3k2 Block. Этот усовершенствованный модуль «бутылочного горлышка» оптимизирует поток градиентов по всей сети, значительно повышая эффективность параметров при сохранении высокой точности. Кроме того, в YOLO11 используется улучшенный механизм пространственного внимания, который критически важен для идентификации мелких или частично перекрытых объектов. Это делает модель исключительным выбором для сценариев использования аэрофотосъемки и детального медицинского анализа изображений.
YOLO11 использует архитектуру без анкоров (anchor-free), что минимизирует сложность настройки гиперпараметров, обеспечивая надежную обобщающую способность на широком спектре пользовательских наборов данных. Более того, требования к памяти во время обучения значительно ниже по сравнению с архитектурами на базе трансформеров, что позволяет исследователям эффективно обучать крупные модели на стандартном потребительском оборудовании.
Link to this sectionИзучение архитектуры YOLOv10#
Детали YOLOv10:
- Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
- Организация: Университет Цинхуа
- Дата: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- Документация: https://docs.ultralytics.com/models/yolov10/
Разработанная исследователями Университета Цинхуа, модель YOLOv10 произвела фурор как первопроходец комплексного (end-to-end) подхода в семействе YOLO. Отличительной чертой YOLOv10 является методология NMS-Free Training. Используя согласованное двойное назначение на этапе обучения, модель предсказывает ровно одну ограничивающую рамку (bounding box) для каждого объекта. Этот прорыв полностью устраняет необходимость в немаксимальном подавлении (NMS) во время инференса — шаге постобработки, который исторически создавал задержки в конвейерах развертывания.
Архитектура также вводит стратегию целостного проектирования эффективности и точности. Она включает пространственно-канальное раздельное понижающее дискретизирование и рангово-управляемые блоки, которые избирательно уменьшают избыточность на этапах сети. Это приводит к меньшему количеству FLOPs и снижению вычислительных затрат без существенной потери средней точности (mAP). Для приложений реального времени, где важна каждая миллисекунда, удаление NMS обеспечивает детерминированный граф инференса, идеально подходящий для граничных ИИ-устройств.
Link to this sectionПоказатели производительности и бенчмарки#
При оценке этих двух моделей мы смотрим на баланс точности, количества параметров и скорости. В следующей таблице показано их сравнение по различным масштабам на наборе данных COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Как видно из показателей производительности YOLO, YOLO11 в целом достигает немного более высоких показателей mAP во всех своих вариантах, особенно в крупных моделях. NMS-free дизайн YOLOv10 обеспечивает высокостабильное время инференса, но YOLO11 по-прежнему демонстрирует исключительную пропускную способность при оптимизации с помощью TensorRT на оборудовании NVIDIA.
При подготовке моделей к развертыванию экспорт в оптимизированные форматы имеет решающее значение. И YOLO11, и YOLOv10 могут быть беспрепятственно экспортированы в такие форматы, как ONNX и TensorRT, с использованием фреймворка Ultralytics. Ознакомься с нашим руководством по вариантам развертывания моделей для получения пошаговых инструкций.
Link to this sectionПреимущества экосистемы Ultralytics#
Хотя показатели автономной производительности важны, именно окружающий фреймворк определяет практический успех проекта машинного обучения. Именно здесь YOLO11, как родной элемент экосистемы Ultralytics, действительно блистает.
Платформа Ultralytics предлагает невероятно оптимизированный пользовательский опыт. Благодаря простому и унифицированному Python API, ты можешь решать задачи, выходящие за рамки простых ограничивающих рамок. YOLO11 поддерживает «из коробки» сегментацию экземпляров, оценку позы, классификацию изображений и обнаружение ориентированных ограничивающих рамок (OBB). Этой огромной универсальности часто не хватает в специализированных исследовательских репозиториях.
Более того, экосистема подкреплена обширной документацией и активной поддержкой сообщества. Интеграции с такими инструментами, как Weights & Biases для отслеживания экспериментов и OpenVINO для оптимизации под оборудование Intel, встроены непосредственно в библиотеку. Обучение модели требует минимального шаблонного кода и выигрывает от высокоэффективных процессов обучения, требующих меньше памяти CUDA, чем тяжелые трансформерные модели вроде RT-DETR.
Link to this sectionПрактический пример кода#
Обучение и запуск инференса с Ultralytics спроектированы так, чтобы быть максимально интуитивно понятными. Тот же самый API одинаково легко обрабатывает и YOLO11, и YOLOv10.
from ultralytics import YOLO
# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")
# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects
inference_results[0].show()Link to this sectionСценарии использования и рекомендации#
Выбор между YOLO11 и YOLOv10 зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать YOLO11#
YOLO11 — отличный выбор для:
- Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
- Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
- Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.
Link to this sectionКогда стоит выбрать YOLOv10#
YOLOv10 рекомендуется для:
- Детекции в реальном времени без NMS: Приложения, которым полезна сквозная (end-to-end) детекция без использования Non-Maximum Suppression, что снижает сложность развертывания.
- Сбалансированного соотношения скорости и точности: Проекты, требующие оптимального баланса между скоростью вывода и точностью детекции для различных масштабов моделей.
- Приложений с постоянной задержкой: Сценарии развертывания, где критически важна предсказуемость времени вывода, например, в робототехнике или автономных системах.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionСледующее поколение: YOLO26#
Хотя YOLOv10 представила революционную парадигму без NMS, а YOLO11 усовершенствовала многозадачную универсальность, сфера ИИ развивается стремительно. Разработчикам, которые начинают новые производственные развертывания сегодня, мы настоятельно рекомендуем изучить Ultralytics YOLO26.
Выпущенная в январе 2026 года, YOLO26 объединяет лучшее из обоих миров. Она нативно использует дизайн End-to-End NMS-Free, заложенный YOLOv10, радикально упрощая конвейер развертывания и обеспечивая стабильную задержку. Кроме того, YOLO26 включает специализированные оптимизации для граничных вычислений. Благодаря выполнению DFL Removal (удаление Distribution Focal Loss), архитектура гарантирует более легкую экспортируемость и обеспечивает до 43% более быстрый инференс на CPU по сравнению с устаревшими моделями, что делает ее лучшим выбором для энергоэффективных IoT-устройств и мобильных приложений.
YOLO26 также привносит стабильность обучения больших языковых моделей (LLM) в компьютерное зрение с помощью инновационного оптимизатора MuSGD Optimizer, гибрида, вдохновленного передовыми исследованиями в области ИИ. В сочетании с функциями потерь ProgLoss + STAL, YOLO26 обеспечивает непревзойденную точность на мелких объектах, что важно для детального видеодетектора трафика и сложной автоматизации робототехники.
Link to this sectionЗаключение#
Выбор правильной модели зрения зависит от твоих конкретных эксплуатационных ограничений. YOLOv10 является значительной вехой в академической среде, доказывая, что NMS может быть эффективно исключено из конвейера обнаружения. Однако для превосходного баланса производительности, всесторонней универсальности задач и бесшовных инструментов развертывания YOLO11 предлагает надежное решение, готовое к промышленному использованию.
Инженерам, которые хотят получить самые современные возможности — сочетание простоты end-to-end с молниеносной производительностью на граничных устройствах — мы настоятельно рекомендуем миграцию на последнюю версию YOLO26. Используя комплексную платформу Ultralytics, ты гарантируешь, что твои проекты построены на хорошо поддерживаемом, высокоэффективном и ориентированном на будущее фундаменте.