YOLO11 YOLOv7: техническое сравнение архитектуры и производительности
По мере ускорения развития области компьютерного зрения выбор правильной архитектуры обнаружения объектов становится критически важным для успеха. Двумя основными конкурентами в YOLO являются YOLO11, разработанная Ultralytics, и YOLOv7, исследовательская модель от Academia Sinica. Хотя обе модели внесли значительный вклад в развитие современных технологий, они удовлетворяют разные потребности в отношении скорости, гибкости и простоты внедрения.
В этом руководстве представлен подробный технический анализ их архитектуры, показателей производительности и идеальных вариантов использования, чтобы помочь разработчикам и исследователям выбрать лучший инструмент для своих проектов.
Обзор модели и истоки
Понимание происхождения этих моделей позволяет понять контекст архитектурных решений, лежащих в их основе.
YOLO11
Выпущено в сентябре 2024 года компанией Ultralytics, YOLO11 усовершенствование философии компании, ориентированной на производство. Он был разработан для максимальной эффективности на современном оборудовании, обеспечивая баланс между высокой пропускной способностью и конкурентоспособной точностью.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: сентябрь 2024 г.
- Основные преимущества: простота использования в режиме реального времени, широкая поддержка задач (обнаружение, сегментация, поза, OBB, классификация) и оптимизированное развертывание через Ultralytics .
YOLOv7
Выпущенная в июле 2022 года, YOLOv7 важной вехой в научной деятельности команды, стоящей за YOLOv4. В ней было представлено несколько «бесплатных бонусов» для повышения точности без увеличения затрат на вывод, с упором на оптимизацию обучаемой архитектуры.
- Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
- Организация: Институт информатики, Academia Sinica
- Дата: Июль 2022
- Основные направления: анализ градиентного пути, перепараметризация модели и динамическое присвоение меток.
Анализ производительности
При сравнении этих архитектур важнейшую роль играют такие показатели, как средняя точность (mAP) и задержка вывода. В таблице ниже показано, как новые инженерные решения в YOLO11 к повышению эффективности по сравнению со старой YOLOv7 .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Основные выводы
- Эффективность: модель YOLO11m достигает немного более высокой точности (51,5% mAP) по сравнению со стандартной YOLOv7 51,4%), при этом используя примерно на 45% меньше параметров (20,1 млн против 36,9 млн) и значительно меньше FLOP.
- Скорость: на графических процессорах T4 YOLO11 стабильно превосходят свои YOLOv7 по задержке вывода, что является критически важным фактором для приложений реального времени, таких как автономное вождение или видеоаналитика.
- Масштабируемость: YOLO11 более широкий диапазон масштабов моделей (от Nano до X-Large), что упрощает развертывание на аппаратном обеспечении с ограниченными ресурсами, таком как Raspberry Pi или мобильные устройства.
Архитектурные различия
Ultralytics YOLO11
YOLO11 на концепции магистральной сети CSPNet (Cross-Stage Partial Network), но усовершенствует блочную структуру для лучшего градиентного потока и извлечения признаков.
- Усовершенствованная основа: использует улучшенный блок C3k2 (более быстрая реализация узких мест CSP), который улучшает повторное использование функций и одновременно сокращает вычисления.
- Обнаружение без анкоров: Как и его непосредственные предшественники, YOLO11 головку без анкоров, упрощая процесс обучения за счет устранения необходимости в ручной кластеризации анкорных рамок.
- Многозадачные головки: архитектура изначально разработана для поддержки нескольких задач с использованием унифицированной структуры головки, что позволяет плавно переключаться между обнаружением объектов, сегментацией экземпляров и оценкой позы.
YOLOv7
YOLOv7 «Extended-ELAN» (E-ELAN) для эффективного управления самыми короткими и самыми длинными градиентными путями.
- E-ELAN: вычислительный блок, разработанный для того, чтобы сеть могла обучаться более разнообразным особенностям без разрушения градиентного пути.
- Перепараметризация модели: использует методы перепараметризации (RepConv) для объединения отдельных слоев свертки в один слой во время вывода, что повышает скорость без потери точности обучения.
- Вспомогательная головка от грубой до тонкой: вводит вспомогательную головку для контроля обучения, которая помогает глубокому контролю модели, но добавляет сложность к процессу обучения.
Эволюция до YOLO26
Хотя YOLO11 значительные улучшения, новейшая версия YOLO26 еще больше расширяет границы возможного. Выпущенная в январе 2026 года, YOLO26 отличается сквозной конструкцией NMS, что устраняет необходимость в постобработке и ускоряет CPU до 43%. В ней также используется оптимизатор MuSGD, вдохновленный обучением LLM, для более быстрой конвергенции.
Обучение и простота использования
Для разработчиков «пользовательский опыт» модели — то, насколько легко ее обучать, проверять и внедрять — часто так же важен, как и исходные метрики.
Преимущество экосистемы Ultralytics
YOLO11 полностью интегрирован в Python Ultralytics Python , предлагая рабочий процесс «от нуля до героя».
- Единый API: Вы можете переключаться между YOLO11, YOLOv8или YOLO26, изменив одну строку.
- Эффективность использования памяти: Ultralytics оптимизированы для использования меньшего CUDA во время обучения по сравнению со многими исследовательскими репозиториями. Это позволяет использовать более крупные пакеты данных на потребительских графических процессорах.
- Экспорт в один клик: экспорт в такие форматы, как ONNX, TensorRT, CoreML или TFLite с помощью одной команды.
from ultralytics import YOLO
# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for deployment
path = model.export(format="onnx")
YOLOv7
YOLOv7 использует отдельный репозиторий. Несмотря на свою мощность, он часто требует:
- Ручная настройка
.yamlфайлы для анкоров (если не используется версия без анкоров). - Специальные скрипты «развертывания» для объединения перепараметризованных весов перед экспортом.
- Более сложные аргументы командной строки для управления вспомогательными головками во время обучения.
Приложения в реальном мире
Когда следует выбирать YOLO11
YOLO11 лучший выбор для коммерческих и промышленных применений, где надежность и простота обслуживания имеют ключевое значение.
- Edge AI: Наличие моделей «Nano» и «Small» делает YOLO11 для интеллектуальных камер и устройств IoT, контролирующих производственные линии.
- Многозадачные проекты: если ваше приложение требует отслеживания объектов с одновременной оценкой ключевых точек (например, спортивная аналитика), унифицированная структура YOLO11 упрощает кодовую базу.
- Быстрое прототипирование: простота использования позволяет командам быстро повторять операции с настраиваемыми наборами данных с помощью Ultralytics , сокращая время вывода продукта на рынок.
Когда выбирать YOLOv7
- Академический бенчмаркинг: если вы воспроизводите результаты из литературы 2022-2023 годов или изучаете конкретные эффекты архитектур E-ELAN.
- Устаревшие системы: для систем, уже глубоко интегрированных с конкретной структурой ввода/вывода исходных YOLO в стиле Darknet.
Заключение
В то время как YOLOv7 остается уважаемым вехой в истории обнаружения объектов, YOLO11 предлагает более современное, эффективное и удобное для разработчиков решение. Благодаря превосходному соотношению скорости и точности, более низким требованиям к памяти и поддержке надежной Ultralytics , YOLO11 более четкий путь к внедрению в реальных условиях.
Тем, кто ищет самые передовые технологии, мы рекомендуем ознакомиться с YOLO26, который основан на этих принципах и использует инференцию NMS и оптимизаторы нового поколения.
Дополнительные ресурсы
- YOLO11 :Официальная документация
- Статья о YOLOv7:Обучаемый набор «бесплатных» приемов устанавливает новый уровень SOTA
- Ultralytics :Простое обучение и развертывание
- GitHub:Репозиторий Ultralytics