YOLOv7 YOLO11: техническое сравнение детекторов реального времени
Эволюция архитектур обнаружения объектов характеризуется быстрым прогрессом в области скорости, точности и простоты внедрения. В данном руководстве представлено подробное техническое сравнение между YOLOv7, современной модели 2022 года, и YOLO11, передовой версии от Ultralytics 2024 Ultralytics . Мы анализируем их архитектурные различия, показатели производительности и пригодность для современных приложений компьютерного зрения.
Краткое изложение
В то время как YOLOv7 значительные архитектурные улучшения, такие как E-ELAN, YOLO11 представляет собой поколенческий скачок в области удобства использования, поддержки экосистемы и эффективности. YOLO11 превосходную производительность на современном оборудовании, значительно упрощает рабочие процессы обучения и YOLO11 встроенную поддержку более широкого спектра задач, выходящих за рамки простого обнаружения.
| Функциональность | YOLOv7 | YOLO11 |
|---|---|---|
| Архитектура | E-ELAN, на основе конкатенации | C3k2, SPPF, оптимизирован для GPU |
| Задачи | Обнаружение, поза, сегментация (ограниченно) | Обнаружение, Сегментация, Классификация, Определение позы, OBB, Отслеживание |
| Простота использования | Высокая сложность (несколько сценариев) | Оптимизированный (унифицированный Python ) |
| Экосистема | Рассеянный (направление исследований) | Интегрированный (Ultralytics ) |
| Развертывание | Требуются скрипты для ручного экспорта | Экспорт в более чем 10 форматов в одну строку |
Подробный анализ
YOLOv7: архитектура «Bag-of-Freebies»
Выпущенная в июле 2022 года, YOLOv7 разработана с целью расширить границы обнаружения объектов в реальном времени за счет оптимизации процесса обучения без увеличения затрат на вывод — концепция, известная как «bag-of-freebies».
Основные технические особенности:
- E-ELAN (Extended Efficient Layer Aggregation Network): эта архитектура позволяет сети изучать более разнообразные особенности путем контроля самых коротких и самых длинных путей градиента, улучшая конвергенцию.
- Масштабирование модели: YOLOv7 методы комбинированного масштабирования, которые одновременно изменяют глубину и ширину для различных ограничений ресурсов.
- Вспомогательная головка: она использует механизм назначения меток «от грубого к тонкому», в котором вспомогательная головка помогает контролировать процесс обучения в более глубоких слоях.
Детали YOLOv7:
- Авторы: Чень-Яо Ван, Алексей Бочковский и Хун-Юань Марк Ляо
- Организация: Институт информатики, Академия Синика
- Дата: 2022-07-06
- Архив: 2207.02696
- GitHub: WongKinYiu/yolov7
YOLO11: Повышенная эффективность и универсальность
YOLO11 на Ultralytics , которые заключаются в приоритете удобства разработчиков наряду с высокой производительностью. В нем внедрены усовершенствования архитектуры, которые снижают вычислительные накладные расходы при сохранении высокой точности, что делает его исключительно быстрым как на периферийных устройствах, так и на облачных графических процессорах.
Основные технические особенности:
- Блок C3k2: усовершенствованная версия узкого места CSP (Cross Stage Partial), использовавшегося в предыдущих версиях, обеспечивающая более качественную экстракцию признаков с меньшим количеством параметров.
- Улучшенный SPPF: слой Spatial Pyramid Pooling - Fast оптимизирован для более эффективного захвата многомасштабного контекста.
- Универсальность задач: в отличие от YOLOv7, который в основном представляет собой модель обнаружения с некоторыми возможностями определения позы, YOLO11 с самого начала YOLO11 разработан для обработки сегментации экземпляров, оценки позы, ориентированных ограничивающих прямоугольников (OBB) и классификации.
- Оптимизированное обучение: YOLO11 передовые стратегии увеличения объема данных и усовершенствованные функции потерь, которые стабилизируют обучение, требуя от пользователя меньшей настройки гиперпараметров.
YOLO11 :
- Авторы: Гленн Джочер и Цзин Цю
- Организация: Ultralytics
- Дата: 27.09.2024
- Документы: Официальная документация
Сравнение производительности
При сравнении этих моделей очень важно учитывать компромисс между скоростью (задержкой) и точностью (mAP). YOLO11 обеспечивает лучший баланс, предлагая высокую точность при значительно более низких вычислительных требованиях (FLOP) и более высокой скорости вывода на современных графических процессорах, таких как NVIDIA .
Эффективность имеет значение
YOLO11 сопоставимой или даже лучшей точности, чем более старые модели с меньшим количеством параметров. Эта «эффективность параметров» напрямую приводит к снижению потребления памяти во время обучения и более быстрому выполнению на периферийных устройствах, таких как NVIDIA Orin Nano.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Как показано в таблице, YOLO11x превосходит YOLOv7 по точности (54,7% против 53,1%), сохраняя при этом сопоставимую скорость GPU . Что еще более важно, меньшие варианты YOLO11 n/s/m) предлагают невероятные преимущества в скорости для приложений, где критически важна обработка в реальном времени, таких как видеоаналитика.
Экосистема и простота использования
Наиболее значительным фактором, отличающим разработчиков, является экосистема, окружающая модель. Именно в этом Ultralytics превосходит Ultralytics .
Преимущество Ultralytics
YOLO11 интегрирован в ultralytics Python , предоставляющий единый интерфейс для всего жизненного цикла машинного обучения.
- Простой API: вы можете загрузить, обучить и проверить модель с помощью всего нескольких строк Python .
- Хорошо поддерживаемая экосистема: Ultralytics обеспечивает активную поддержку, частые обновления и беспроблемную интеграцию с такими инструментами, как Ultralytics для управления данными.
- Гибкость развертывания: для экспорта YOLO11 ONNX, TensorRT, CoreML или TFLite всего одна команда. В отличие от этого, YOLOv7 требует сложных сторонних репозиториев или ручной настройки скриптов для разных форматов экспорта.
Сравнение кодов:
Обучение YOLO11:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Обучение YOLOv7: Обычно требует клонирования репозитория, установки определенных зависимостей и запуска длинных аргументов командной строки:
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'
Реальные примеры использования
Когда выбирать YOLOv7
- Сравнительный анализ устаревших технологий: если вы проводите академические исследования и вам необходимо сравнить новые архитектуры с передовыми стандартами 2022 года.
- Конкретные пользовательские реализации: если у вас есть существующий конвейер, сильно настроенный под конкретные tensor YOLOv7 , и вы не можете позволить себе его рефакторинг.
Когда следует выбирать YOLO11
- Производственное внедрение: для коммерческого применения в розничной торговле, сфере безопасности или производстве, где надежность и простота обслуживания имеют первостепенное значение.
- Edge Computing: Эффективность YOLO11n и YOLO11s делает их идеальными для работы на Raspberry Pi или мобильных устройствах с ограниченной мощностью.
- Многозадачные приложения: если ваш проект требует одновременного обнаружения объектов, их сегментирования и оценки их положения, YOLO11 этой задачей без дополнительных усилий.
Передовые технологии: YOLO26
Хотя YOLO11 отличным выбором для большинства приложений, Ultralytics внедрять инновации. Недавно выпущенный YOLO26 (январь 2026 г.) еще больше расширяет границы возможного.
- Полная NMS: YOLO26 устраняет немаксимальное подавление (NMS), что приводит к упрощению процессов развертывания и снижению задержки.
- Оптимизация полей: благодаря устранению распределенного фокального убытка (DFL) YOLO26 обеспечивает ускорение CPU до 43%, что делает его лучшим выбором для полей искусственного интеллекта.
- Оптимизатор MuSGD: Вдохновленный обучением LLM, этот гибридный оптимизатор обеспечивает стабильную сходимость.
Разработчикам, которые сегодня приступают к новому высокопроизводительному проекту, настоятельно рекомендуется изучить YOLO26.
Заключение
YOLOv7 YOLO11 важными вехами в истории компьютерного зрения. YOLOv7 мощные архитектурные концепции, которые продвинули эту область вперед. Однако YOLO11 усовершенствовал эти идеи, превратив их в более практичный, быстрый и удобный для пользователя пакет.
Для подавляющего большинства пользователей — от исследователей до инженеров предприятий —YOLO11 или более новая версия YOLO26) предлагает оптимальное сочетание точности, скорости и удобства для разработчиков, подкрепленное надежной Ultralytics .
Другие модели для изучения
- YOLO26: новейшая модель NMS для максимальной скорости и точности.
- YOLOv10: пионер в области обучения NMS для обнаружения в реальном времени.
- RT-DETR: детектор на основе трансформатора для сценариев с высокой точностью.
- SAM : Модель Meta Segment Anything для сегментации без обучения.