Перейти к содержанию

YOLOv7 против YOLO11: от наследия в реальном времени к современной эффективности

Навигация по ландшафту моделей компьютерного зрения предполагает понимание нюансов между устоявшимися архитектурами и последними современными инновациями (SOTA). В данном руководстве приводится всестороннее техническое сравнение между YOLOv7, значительной вехой в серии YOLO , и Ultralytics YOLO11передовой моделью, созданной для обеспечения превосходной производительности и универсальности.

Мы рассмотрим их архитектурные различия, эталонные метрики и практические приложения, чтобы помочь разработчикам и исследователям выбрать оптимальный инструмент для решения самых разных задач - от обнаружения объектов до сегментации сложных экземпляров.

YOLOv7: эталон эффективной архитектуры

Выпущенный в июле 2022 года, YOLOv7 представляет собой значительный скачок вперед в балансе между эффективностью обучения и скоростью вывода. Он был разработан для того, чтобы превзойти предыдущие детекторы, благодаря оптимизации архитектуры, которая позволяет уменьшить количество параметров без ущерба для точности.

Авторы: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
Organization:Institute of Information Science, Academia Sinica, Taiwan
Date: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docsultralytics

Архитектурные особенности

В YOLOv7 появилась расширенная эффективная сеть агрегирования слоев (E-ELAN). Эта архитектура позволяет модели изучать более разнообразные характеристики, управляя кратчайшими и длинными градиентными путями, что улучшает сходимость в процессе обучения. Кроме того, в модели используется "обучаемый мешок бесплатных вещей" - набор стратегий оптимизации, таких как перепараметризация модели и динамическое присвоение меток, которые повышают точность без увеличения стоимости вывода.

Несмотря на то, что YOLOv7 в первую очередь является моделью обнаружения объектов, сообщество разработчиков с открытым исходным кодом изучило возможности расширения YOLOv7 для оценки позы. Однако в этих реализациях часто отсутствует бесшовная интеграция, характерная для унифицированных фреймворков.

Сильные стороны и ограничения

YOLOv7 уважают за его:

  • Высокая производительность: Сразу после выхода он установил новый базовый уровень для детекторов реального времени, показав отличные результаты на наборе данныхCOCO .
  • Архитектурные инновации: Появление E-ELAN повлияло на последующие исследования в области проектирования сетей.

Однако в современных рабочих процессах он сталкивается с трудностями:

  • Сложность: Конвейер обучения может быть сложным, требующим значительной ручной настройки по сравнению с современными стандартами.
  • Ограниченная универсальность: Он не поддерживает такие задачи, как классификация или ориентированные ограничительные рамки (OBB).
  • Использование ресурсов: Обучение больших вариантов, таких как YOLOv7x, требует значительных ресурсов GPU памяти, что может стать узким местом для исследователей с ограниченным аппаратным обеспечением.

Узнайте больше о YOLOv7

Ultralytics YOLO11: новое определение скорости, точности и простоты использования

Ultralytics YOLO11 это новейшая разработка в знаменитой линейке YOLO , созданная для обеспечения производительности SOTA в широком спектре задач компьютерного зрения. Построенный на принципах непрерывного совершенствования, YOLO11 предлагает усовершенствованную архитектуру, которая обеспечивает максимальную эффективность при развертывании в реальных условиях.

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11

Передовая архитектура и универсальность

В YOLO11 используется модернизированная основа с использованием блоков C3k2 и улучшенного модуля SPPF для более эффективного захвата особенностей на различных масштабах. В результате модель получилась не только более точной, но и значительно более легкой по параметрам и FLOPs по сравнению с предшественниками и конкурентами.

Определяющей характеристикой YOLO11 является встроенная поддержка многозадачности. В рамках одного фреймворка пользователи могут выполнять:

  • Обнаружение: Идентификация объектов с ограничивающими рамками.
  • Сегментация: Маскирование на уровне пикселей для точного анализа формы.
  • Классификация: присвоение меток классов всем изображениям.
  • Оценка позы: Обнаружение ключевых точек на человеческих телах.
  • OBB: обнаружение вращающихся объектов, что очень важно для аэрофотосъемки.

Единая экосистема

Ultralytics YOLO11 легко интегрируется с Ultralytics HUB, платформой для управления наборами данных, обучения без кода и развертывания в один клик. Эта интеграция значительно ускоряет жизненный цикл MLOps.

Почему разработчики выбирают YOLO11

  • Простота использования: Ориентированный на пользователя дизайн YOLO11 можно реализовать всего в нескольких строках кода на Python или с помощью простого CLI.
  • Хорошо поддерживаемая экосистема: Поддерживаемая активным сообществом и командой Ultralytics , модель получает частые обновления, обеспечивающие совместимость с последними версиями PyTorch и аппаратными ускорителями.
  • Баланс производительности: Достигается исключительный компромисс между скоростью вывода и средней точностью (mAP), что делает его идеальным как для пограничных устройств, так и для облачных серверов.
  • Эффективность использования памяти: Модели YOLO11 обычно требуют меньше памяти CUDA во время обучения по сравнению со старыми архитектурами или моделями на основе трансформаторов, что позволяет использовать большие объемы партий или проводить обучение на скромном оборудовании.

Узнайте больше о YOLO11

Сравнение производительности: Технические бенчмарки

Следующая таблица иллюстрирует разницу в производительности между YOLOv7 и YOLO11. Данные подчеркивают, что современные оптимизации позволяют YOLO11 достигать превосходной точности при меньших вычислительных затратах.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Анализ:

  • Эффективность: YOLO11m соответствует точности YOLOv7l (51,5 против 51,4 mAP) при использовании почти половины параметров (20,1M против 36,9M) и значительно меньшем количестве FLOP.
  • Скорость: В приложениях реального времени YOLO11n работает значительно быстрее - 1,5 мс на GPU T4, что делает его идеальным для обработки видео с высокой частотой кадров.
  • Точность: Самая крупная модель, YOLO11x, превосходит YOLOv7x по точности (54,7 против 53,1 mAP), сохраняя при этом конкурентоспособное количество параметров.

Реальные примеры использования

Сельское хозяйство и мониторинг окружающей среды

В точном земледелии для выявления болезней сельскохозяйственных культур или мониторинга роста требуются модели, способные работать на устройствах с ограниченной мощностью, таких как беспилотники или полевые датчики.

  • YOLO11: его легкая архитектура (в частности, YOLO11n/s) позволяет развертывать устройства на базе Raspberry Pi или NVIDIA Jetson, что обеспечивает мониторинг состояния сельскохозяйственных культур в режиме реального времени.
  • YOLOv7: Несмотря на свою точность, высокая потребность в вычислениях ограничивает его применение на устройствах с питанием от аккумулятора.

Интеллектуальное производство и контроль качества

Автоматизированные системы визуального контроля требуют высокой точности для detect мельчайших дефектов на производственных линиях.

  • YOLO11: способность модели выполнять сегментацию и OBB имеет решающее значение. Например, OBB необходим для обнаружения вращающихся компонентов на конвейерной ленте - функция, изначально поддерживаемая YOLO11 , но требующая пользовательской реализации в YOLOv7.
  • YOLOv7: подходит для стандартного обнаружения ограничительных рамок, но менее приспособлен для сложных геометрических дефектов без существенной модификации.

Наблюдение и безопасность

Системы безопасности часто обрабатывают несколько видеопотоков одновременно.

  • YOLO11: Высокая скорость вывода позволяет одному серверу обрабатывать больше потоков параллельно, что снижает затраты на инфраструктуру.
  • YOLOv7: Эффективно, но более высокая задержка на кадр снижает общее количество каналов, с которыми может работать одно устройство.

Эффективность внедрения и обучения

Одной из отличительных особенностей экосистемы Ultralytics является оптимизированный опыт разработчиков. Ниже приведено сравнение того, как начать работу.

Простота в коде

Ultralytics YOLO11 разработан по принципу "батарейки в комплекте", абстрагируясь от сложного шаблонного кода.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

В отличие от этого, старые репозитории часто требуют клонирования репозитория, ручной настройки конфигурационных файлов и запуска сложных сценариев оболочки для обучения и вывода.

Гибкость экспорта

YOLO11 поддерживает экспорт в различные форматы для развертывания одним щелчком мыши, включая ONNX, TensorRT, CoreML и TFLite. Такая гибкость гарантирует, что ваша модель будет готова к производству в любой среде.

Заключение: Явный победитель

Пока YOLOv7 остается достойной внимания моделью в истории компьютерного зрения, Ultralytics YOLO11 представляет собой будущее. Для разработчиков и исследователей YOLO11 предлагает привлекательный пакет услуг:

  1. Превосходные показатели: Более высокий mAP и более высокая скорость вывода.
  2. Богатая экосистема: Доступ к Ultralytics HUB, обширная документация и поддержка сообщества.
  3. Универсальность: Единая система для обнаружения, сегментации, позиционирования, классификации и OBB.
  4. Перспективность: Постоянные обновления и обслуживание обеспечивают совместимость с новыми аппаратными и программными библиотеками.

Для любого нового проекта необходимо использовать эффективность и простоту использования YOLO11 это рекомендуемый путь к достижению самых современных результатов с минимальными трудностями.

Изучите другие модели

Если вас интересуют дальнейшие сравнения, изучите эти связанные страницы в документации:


Комментарии