Перейти к содержанию

YOLOv6.0 против YOLOv7: технический анализ детекторов объектов в реальном времени

Выбор подходящей модели обнаружения объектов для приложений компьютерного зрения часто сопряжен с необходимостью ориентироваться в сложной системе скорости, точности и архитектурных нюансов. Двумя важными вехами в этой эволюции являются YOLOv6.YOLOv6 и YOLOv7, которые при своем выпуске расширили границы возможного в области вывода в реальном времени. В этом всестороннем сравнении рассматриваются архитектурные различия, показатели производительности и идеальные сценарии развертывания, чтобы помочь разработчикам принять обоснованные решения.

Краткий обзор производительности

В следующей таблице приведены показатели производительности сопоставимых вариантов обеих моделей. Ключевые значения указывают, в каких конкретных конфигурациях одна модель может иметь преимущество перед другой.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

YOLOv6.0: эффективность промышленного уровня

YOLOv6.YOLOv6, часто называемыйYOLOv6 .0», представляет собой значительную итерацию в YOLOv6 , разработанной Meituan. Выпущенная в январе 2023 года, эта версия была в значительной степени сосредоточена на «перезагрузке» архитектуры, чтобы лучше обслуживать промышленные приложения, в которых GPU имеет решающее значение.

Подробности о YOLOv6-3.0:

Узнайте больше о YOLOv6

Архитектурные инновации

YOLOv6.YOLOv6 представляет несколько ключевых усовершенствований, предназначенных для максимального повышения эффективности аппаратных ускорителей, таких как графические процессоры NVIDIA :

  1. Двунаправленное соединение (BiC): этот модуль улучшает объединение функций, облегчая обмен информацией между различными уровнями сети, что повышает эффективность обнаружения объектов на разных расстояниях.
  2. Обучение с помощью якорей (AAT): хотя вывод модели остается без якорей, YOLOv6. YOLOv6 использует вспомогательную ветвь на основе якорей во время обучения. Эта гибридная стратегия стабилизирует сходимость и повышает конечную точность, не влияя на скорость вывода.
  3. Репараметризация: интенсивно используя блоки типа RepVGG, модель упрощает сложные многоветвистые структуры до однопутевых сверток во время вывода. Это приводит к значительному увеличению скорости на GPU .

Идеальные варианты использования

Благодаря специфическим оптимизациям YOLOv6.0 превосходит другие системы по следующим параметрам:

  • Контроль качества производства: высокоскоростное обнаружение дефектов на сборочных линиях, где пропускная способность (FPS) является основным ограничивающим фактором.
  • Логистика и сортировка: быстрая идентификация посылок в крупных распределительных центрах с использованием автоматизированных конвейеров машинного обучения.
  • Видеоаналитика: одновременная обработка нескольких видеопотоков на серверных графических процессорах для обеспечения безопасности или анализа данных в сфере розничной торговли.

YOLOv7: Мощность "Bag-of-Freebies"

YOLOv7 был выпущен в июле 2022 года и быстро зарекомендовал себя как передовой детектор. Авторы сосредоточились на архитектурных реформах, которые повышают эффективность обучения и точность вывода без значительного увеличения количества параметров, назвав эти методы «обучаемым набором бесплатных функций».

Детали YOLOv7:

Узнайте больше о YOLOv7

Архитектурные инновации

YOLOv7 концепции, которые усовершенствовали способы обучения нейронных сетей и распространения информации о градиентах:

  1. E-ELAN (Extended Efficient Layer Aggregation Network): эта структура контролирует самые короткие и самые длинные пути градиента, позволяя сети обучаться более разнообразным особенностям без проблемы исчезновения градиента, часто встречающейся в глубоких сетях.
  2. Масштабирование модели: YOLOv7 метод комбинированного масштабирования, который одновременно изменяет глубину и ширину для моделей на основе конкатенации, обеспечивая оптимальную архитектуру для моделей разных размеров (от Tiny до E6E).
  3. Плановая перепараметризация: аналогично YOLOv6, использует перепараметризацию, но применяет строго запланированные стратегии для определения модулей, которые следует упростить, уравновешивая остаточные связи с простыми свертками.

Идеальные варианты использования

YOLOv7 особенно хорошо подходит для:

  • Детальное извлечение признаков: сценарии, такие как автономные транспортные средства, где распознавание мелких деталей на небольших объектах (например, удаленных светофорах) имеет решающее значение.
  • Edge AI на устройствах с низким энергопотреблением: вариант YOLOv7 очень эффективен для мобильных устройств, обеспечивая оптимальный баланс между точностью и скоростью на ограниченном аппаратном обеспечении.
  • Исследовательские базовые показатели: благодаря прозрачной архитектуре и обширным исследованиям абляции эта платформа является фаворитом для академических исследований в области поиска нейронных архитектур.

Критическое сравнение: сильные и слабые стороны

При выборе между YOLOv6. YOLOv6 и YOLOv7 решение часто зависит от конкретной цели развертывания оборудования и характера визуальной задачи.

Компромисс между скоростью и точностью

YOLOv6.YOLOv6 обычно достигает более высокой пропускной способности на специализированных графических процессорах (таких как NVIDIA ) благодаря агрессивной перепараметризации и дизайну, TensorRT. Например, модель YOLOv6.YOLOv6 достигает 52,8% mAP очень низкой задержкой. И наоборот, YOLOv7 сосредоточена на эффективности параметров. Модель YOLOv7 обеспечивает немного более высокую точность (53,1% mAP), но с большим количеством параметров и более высокой вычислительной сложностью (FLOP), что может повлиять на задержку на периферийных устройствах.

Методология обучения

«Обучение с помощью якорей» YOLOv6 — это уникальная функция, которая стабилизирует обучение, но усложняет код конвейера обучения. Чистый подход «bag-of-freebies» YOLOv7 сохраняет цикл обучения в некоторой степени стандартным, но опирается на сложные архитектурные определения, такие как E-ELAN. Разработчики, занимающиеся настраиваемым обучением, могут счесть вспомогательные головки YOLOv6 для скорости сходимости.

Особенности развертывания

Если ваша среда развертывания основана исключительноGPU NVIDIA (например, облачные серверы или устройства Jetson), YOLOv6.YOLOv6 часто обеспечивает лучшую производительность в кадрах в секунду на доллар. Однако, если вам нужна модель, которая хорошо обобщается на различном оборудовании (ЦП, НПП) без значительной настройки, YOLOv7 или более новые Ultralytics часто являются более гибкими.

Преимущество Ultralytics

Хотя YOLOv6 YOLOv7 отличными моделями, их использование в Ultralytics дает явные преимущества, которые оптимизируют весь жизненный цикл машинного обучения.

  • Единый API:Python Ultralytics Python упрощает работу с различными архитектурами. Вы можете переключаться между YOLOv6, YOLOv7 и более новыми моделями, такими как YOLO26, изменив одну строку в коде.
  • Хорошо поддерживаемая экосистема: в отличие от исследовательских репозиториев, которые часто перестают обновляться, Ultralytics совместимость с последними версиями PyTorch, CUDA и Python.
  • Универсальность: Ultralytics широкий спектр задач, выходящих за рамки простого обнаружения, включая сегментацию экземпляров, оценку позы и обнаружение ориентированных объектов (OBB).
  • Эффективность использования памяти: Ultralytics оптимизированы для снижения использования VRAM во время обучения, что позволяет обучать мощные модели на графических процессорах потребительского класса, в отличие от исходных кодовых баз, которые часто требуют большого объема памяти.

Переход к передовым технологиям: YOLO26

Для разработчиков, стремящихся к максимальной производительности и простоте использования, недавно выпущенная версия YOLO26 основана на наследии предыдущих версий YOLO и отличается значительными архитектурными усовершенствованиями.

Выпущенная в январе 2026 года, YOLO26 разработана как окончательная модель «edge-first». Она отличается встроенной конструкцией End-to-End NMS Design, которая устраняет необходимость в постобработке Non-Maximum Suppression. Это позволяет значительно ускорить CPU — до 43 % по сравнению с предыдущими поколениями — и упрощает процессы развертывания за счет удаления чувствительных гиперпараметров.

Узнайте больше о YOLO26

Кроме того, YOLO26 использует оптимизатор MuSGD, гибридный алгоритм, вдохновленный методами обучения LLM, который обеспечивает стабильность и быструю конвергенцию. Благодаря удалению DFL модель легче экспортировать в такие форматы, как ONNX или TensorRT для широкой совместимости с устройствами.

Пример кода

Запуск этих моделей с помощью Ultralytics сложности. В следующем примере показано, как загрузить предварительно обученную модель и выполнить инференцию по изображению:

from ultralytics import YOLO

# Load a YOLOv6, YOLOv7, or the recommended YOLO26 model
model = YOLO("yolov6n.yaml")  # or "yolov7.pt" or "yolo26n.pt"

# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Заключение

Как YOLOv6.0, так и YOLOv7 сыграли ключевую роль в развитии технологии обнаружения объектов в реальном времени. YOLOv6. YOLOv6 оптимизировал архитектуру для GPU , что сделало его сильным конкурентом для промышленных приложений. YOLOv7 границы агрегации характеристик и градиентного потока, предлагая надежную производительность для сложных сцен.

Однако эта область развивается очень быстро. Используя Ultralytics , разработчики могут получить доступ к этим моделям наряду с передовой YOLO26, что гарантирует им всегда иметь лучший инструмент для работы. Независимо от того, что вы считаете более важным — сырую GPU YOLOv6 архитектурную изобретательность YOLOv7, Ultralytics объединяет их в единый мощный рабочий процесс.

Для более подробного изучения связанных моделей рекомендуем ознакомиться с документацией по YOLOv8, YOLOv9и YOLO11.


Комментарии