Перейти к содержанию

YOLOv6-3.0 против YOLOv5: Техническое сравнение детекторов объектов реального времени

Область обнаружения объектов в реальном времени переживает бурное развитие, и несколько архитектур соревнуются за лидерство по скорости и точности. Двумя важными вехами на этом пути являются YOLOv6.YOLOv6 и YOLOv5. Хотя обе архитектуры принадлежат к линейкеYOLO(You Only Look Once, «смотришь только один раз»), они значительно различаются по философии проектирования, целям оптимизации и предполагаемым сценариям использования.

В этом руководстве представлен подробный технический анализ этих двух моделей, который поможет разработчикам и инженерам выбрать подходящий инструмент для своих приложений компьютерного зрения. Мы рассмотрим их архитектурные различия, тестовые показатели производительности и сравним их с современными решениями, такими как Ultralytics .

Краткий обзор показателей эффективности

В таблице ниже представлены результаты работы обеих моделей на COCO , который является стандартным тестом для обнаружения объектов.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv6-3.0: Промышленный тяжеловес

YOLOv6.YOLOv6, часто называемыйYOLOv6 .0: A Full-Scale Reloading», разработан исследователями из Meituan. Выпущенный в январе 2023 года, он специально предназначен для промышленных приложений, где доступно специальное оборудование, в частности NVIDIA .

Архитектура и Дизайн

YOLOv6 значительно модифицированную основу, вдохновленную RepVGG. Эта архитектура использует структурную перепараметризацию, что позволяет модели иметь сложную многоветвистую топологию во время обучения, но сводиться к простому высокоскоростному стеку 3x3 сверток во время вывода.

Ключевые особенности включают:

  • Конструкция без якорей: устраняет сложность настройки гиперпараметров якорной коробки, упрощая процесс обучения.
  • SimOTA Label Assignment: усовершенствованная стратегия присвоения меток, которая динамически сопоставляет объекты реальной действительности с прогнозами, улучшая конвергенцию.
  • Учет квантования: модель построена с учетом метода обучения с учетом квантования (QAT), что обеспечивает минимальную потерю точности при преобразовании в INT8 для развертывания в TensorRT.

Сильные и слабые стороны

Основная сила YOLOv6 заключается в его сырой пропускной способности на графических процессорах. Благодаря оптимизации для аппаратных операций он достигает впечатляющей частоты кадров в секунду на таких устройствах, как Tesla T4. Однако такая специализация имеет свою цену. Перепараметризованная архитектура может быть менее эффективной на процессорах или мобильных устройствах, где пропускная способность памяти является узким местом. Кроме того, его экосистема более фрагментирована по сравнению с унифицированным опытом, предлагаемым Ultralytics.

Узнайте больше о YOLOv6

YOLOv5: универсальный стандарт

YOLOv5, созданный Гленном Джочером и Ultralytics , произвел революцию в области доступности обнаружения объектов. С момента своего выпуска в июне 2020 года он стал одной из наиболее широко используемых моделей искусственного интеллекта в области зрения во всем мире, известной своей простотой «от нуля до героя».

Архитектура и Дизайн

YOLOv5 магистраль CSPDarknet, которая обеспечивает баланс между возможностями извлечения признаков и вычислительной эффективностью. В ней было внедрено несколько инноваций, которые сейчас стали стандартом, таких как слой Focus (в ранних версиях) и широкое использование функций активации SiLU.

Ключевые особенности включают:

  • Ориентированная на пользователя экосистема: YOLOv5 не просто модель, а полноценная платформа. Она включает в себя бесшовные интеграции для увеличения объема данных, эволюции гиперпараметров и развертывания.
  • Широкая поддержка оборудования: в отличие от моделей, оптимизированных исключительно для высокопроизводительных графических процессоров, YOLOv5 надежно YOLOv5 на процессорах, периферийных устройствах, таких как Raspberry Pi, и мобильных чипсетах через TFLite.
  • Многозадачность: помимо простого обнаружения, YOLOv5 сегментацию и классификацию экземпляров, что делает его гибким выбором для сложных проектов.

Сильные и слабые стороны

YOLOv5 универсальностью и простотой использования. Его требования к памяти во время обучения значительно ниже, чем у многих конкурентов, что позволяет пользователям проводить обучение на графических процессорах потребительского класса. Хотя более новые модели могут превосходить его по чистым показателям тестирования на определенном оборудовании, YOLOv5 надежным, проверенным в бою решением для приложений общего назначения.

Узнайте больше о YOLOv5

Идеально подходящие варианты использования

Когда следует выбирать YOLOv6-3.0

YOLOv6-3.0 является сильным конкурентом для строго промышленных условий, где:

  • Специализированное GPU : в среде развертывания используются исключительно NVIDIA (такие как T4, V100 или Jetson Orin) и TensorRT.
  • Пропускная способность имеет решающее значение: в таких сценариях, как высокоскоростная инспекция производственной линии, где миллисекундная задержка на определенном оборудовании является единственным показателем успеха.

Когда выбирать YOLOv5

YOLOv5 лучшим выбором для более широкого спектра применений:

  • CPU на периферийных устройствах и CPU : для таких устройств, как Raspberry Pi, мобильные телефоны или облачные инстансы CPU, архитектура YOLOv5 обеспечивает лучшую совместимость и скорость.
  • Быстрое прототипирование: простота обучения и обширная документация позволяют разработчикам за несколько часов пройти путь от набора данных до развернутой модели.
  • Обучение с ограниченными ресурсами: если вы проводите обучение на ограниченном оборудовании (например, на одном GPU 8 ГБ видеопамяти), эффективность YOLOv5 не имеет себе равных.

Ultralytics : за пределами модели

Хотя архитектура имеет большое значение, успех проекта часто зависит от экосистемы, окружающей модель. Ultralytics , включая YOLOv5 ее последующие версии, обладают рядом явных преимуществ:

  1. Простота использования:Python Ultralytics объединяет обучение, валидацию и инференцию. Переключение между YOLOv5, YOLO11или YOLO26 требует изменения только одной строки в вашем коде.
  2. Хорошо поддерживаемая экосистема: активная разработка, частые обновления и активное сообщество гарантируют быстрое устранение ошибок и беспроблемную интеграцию новых функций (таких как модели мира).
  3. Эффективность обучения: Ultralytics эффективности обучения, предоставляя оптимизированные предварительно обученные веса, которые быстро сходятся на пользовательских данных.
  4. Интеграция платформы: Ultralytics предлагает решение без использования кода для управления наборами данных, обучения моделей в облаке и развертывания на различных конечных точках без управления инфраструктурой.

Простая интеграция

Ultralytics поддерживают экспорт в один клик в ONNX, CoreML, OpenVINOи TensorRT, что значительно сокращает инженерные затраты, необходимые для развертывания.

Рекомендация: Будущее за YOLO26

Разработчикам, начинающим новые проекты в 2026 году, мы настоятельно рекомендуем не ограничиваться устаревшими моделями и обратить внимание на Ultralytics .

YOLO26 представляет собой вершину эффективности и точности. Он устраняет ограничения как YOLOv5 компромисс между скоростью и точностью), так и YOLOv6 жесткость аппаратного обеспечения) благодаря революционному дизайну.

  • Нативная сквозная обработка: YOLO26 устраняет необходимость в немаксимальном подавлении (NMS) — этапе постобработки, который усложняет развертывание и увеличивает задержку. Это упрощает и ускоряет работу конвейера.
  • CPU : благодаря удалению Distribution Focal Loss (DFL) и специальным архитектурным доработкам YOLO26 достигает до 43% более быстрой инференции на ЦП, что делает его идеальным для пограничных вычислений.
  • Оптимизатор MuSGD: вдохновленный инновациями в области обучения больших языковых моделей (LLM), новый оптимизатор MuSGD обеспечивает стабильную динамику обучения и более быструю конвергенцию даже на небольших наборах данных.
  • Улучшенное обнаружение мелких объектов: внедрение функций ProgLoss и STAL значительно повышает производительность при обнаружении мелких объектов, что является важным требованием для задач аэрофотосъемки и дистанционного зондирования.

Узнайте больше о YOLO26

Пример кода

Ultralytics разработан таким образом, чтобы быть совместимым со всеми поколениями моделей. Вот как легко можно загрузить и запустить инференцию, независимо от того, используете ли вы YOLOv5 рекомендуемый YOLO26.

from ultralytics import YOLO

# Load the recommended YOLO26 model (or YOLOv5)
# Switch to 'yolov5s.pt' to use YOLOv5
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# The predict method returns a list of Result objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    result.show()  # Display result to screen
    result.save(filename="result.jpg")  # Save result to disk

Пользователям, заинтересованным в других современных возможностях, рекомендуется ознакомиться с YOLO для обнаружения открытого словаря или RT-DETR для обеспечения точности на основе трансформатора.

Заключение

Как YOLOv6.0, так и YOLOv5 сыграли ключевую роль в развитии компьютерного зрения. YOLOv6 границы GPU , а YOLOv5 доступ к мощным инструментам искусственного интеллекта YOLOv5 . Однако эта область развивается очень быстро. С YOLO26 Ultralytics лучшее из обоих миров: скорость аппаратно-ориентированного дизайна, простоту сквозного конвейера и универсальность комплексной экосистемы. Независимо от того, развертываете ли вы систему на производстве или в мобильном приложении, Ultralytics остается лучшим выбором для создания масштабируемых и поддерживаемых решений искусственного интеллекта.


Комментарии