Перейти к содержанию

YOLO11 YOLOv8: эволюция обнаружения объектов в реальном времени

Развитие архитектуры YOLO You Only Look Once) постоянно пересматривает границы компьютерного зрения. YOLO11, выпущенная в конце 2024 года, основана на прочном фундаменте, заложенном YOLOv8 , обеспечивая повышенную эффективность и точность. В данном анализе рассматриваются изменения в архитектуре, показатели производительности и практические соображения по внедрению обеих моделей, что поможет разработчикам сделать оптимальный выбор для своих конкретных приложений.

Краткий обзор показателей эффективности

В следующей таблице показаны улучшения производительности YOLO11 YOLOv8 моделей различных размеров. YOLO11 обеспечивает более высокую среднюю точность (mAP) при сохранении конкурентоспособной скорости вывода, особенно при оптимизации для CPU .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Архитектурный обзор

Обе модели основаны на Ultralytics , которая заключается в создании пользовательского интерфейса, ориентированного на удобство использования без ущерба для мощности. Однако усовершенствования архитектуры YOLO11 расширить возможности извлечения признаков с меньшим количеством параметров.

YOLO11: Усовершенствованная эффективность

Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 27.09.2024
GitHub:ultralytics
Документация:YOLO11

YOLO11 обновленную архитектуру основной сети и шеи, которая улучшает интеграцию функций. Благодаря оптимизации блоков Cross Stage Partial (CSP) YOLO11 значительно YOLO11 количество FLOP (операций с плавающей запятой в секунду) и одновременно повышает mAP. Такая эффективность делает его особенно подходящим для ограниченных сред, таких как периферийные вычислительные устройства.

Узнайте больше о YOLO11

YOLOv8: надежный стандарт

Авторы: Гленн Джочер, Аюш Чаурасия, Цзин Цю
Организация:Ultralytics
Дата: 10.01.2023
GitHub:ultralytics
Документация:YOLOv8

YOLOv8 надежной и универсальной моделью. Она стала пионером в области безякорных головок обнаружения в Ultralytics , упростив процесс обучения за счет устранения необходимости ручного расчета якорных рамок. Ее проверенная track в различных отраслях, от сельского хозяйства до производства, делает ее безопасным и надежным выбором для устаревших систем.

Узнайте больше о YOLOv8

Совместимость архитектуры

Как YOLO11 YOLOv8 изначально YOLOv8 ultralytics Python . Переключение между ними часто сводится к простой замене строки имени модели (например, с yolov8n.pt в yolo11n.pt) в вашем коде, сохраняя существующий конфигурация набора данных и обучающие программы.

Основные преимущества моделей Ultralytics

Независимо от конкретной версии, выбор Ultralytics дает явные преимущества по сравнению с другими фреймворками.

  1. Хорошо поддерживаемая экосистема: обе модели пользуются активной поддержкой со стороны разработчиков и сообщества. Регулярные обновления обеспечивают совместимость с последними версиями PyTorch и CUDA, сводя к минимуму техническую задолженность.
  2. Требования к памяти: Ultralytics свои модели с учетом эффективного использования памяти. По сравнению с массивными детекторами на основе трансформаторов, YOLO требуют значительно меньше GPU (VRAM) во время обучения, что делает их доступными для разработчиков, использующих потребительское оборудование.
  3. Универсальность: помимо простых ограничительных рамок, обе архитектуры поддерживают сегментацию экземпляров, оценку позы, OBB (ориентированные ограничительные рамки) и классификацию.
  4. Эффективность обучения: предварительно обученные веса легко доступны, что позволяет осуществлять перенос обучения, который значительно сокращает время обучения и потребление энергии.

Реальные примеры использования

Выбор между YOLO11 YOLOv8 зависит от конкретных ограничений среды развертывания.

Где превосходит YOLO11

YOLO11 лучший выбор для приложений, чувствительных к задержкам. Уменьшенное количество параметров и более низкие FLOP обеспечивают более быстрое вычисление на CPU и мобильных процессорах.

  • Smart Retail: для анализа поведения клиентов в режиме реального времени на серверах магазинов без использования специальных графических процессоров.
  • Снимки с дронов: обработка аэрофотоснимков высокого разрешения, когда важна каждая миллисекунда времени работы батареи. Улучшенная функция обнаружения мелких объектов имеет здесь решающее значение.
  • Мобильные приложения: развертывание через CoreML или TFLite на Android iOS Android позволяет воспользоваться преимуществами более легкой архитектуры.

Где YOLOv8 сильным

YOLOv8 идеально YOLOv8 для устоявшихся рабочих процессов, где важна стабильность.

  • Промышленная автоматизация: на заводах, где уже стандартизирована система YOLOv8 контроля качества, продолжение использования v8 позволяет избежать необходимости повторной валидации всего конвейера.
  • Академические исследования: Являясь широко цитируемой базовой моделью, YOLOv8 отличным ориентиром для сравнения новых архитектурных новинок.

Простота использования и внедрения

Одной из отличительных черт Ultralytics является унифицированный API. Разработчики могут обучать, проверять и развертывать любую модель, используя идентичный синтаксис.

from ultralytics import YOLO

# Load a model (switch 'yolo11n.pt' to 'yolov8n.pt' to use v8)
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a local image
results = model("path/to/image.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

Эта простота распространяется и на интерфейс командной строки (CLI), что позволяет быстро создавать прототипы без написания единой строки на Python.

# Train YOLO11n
yolo train model=yolo11n.pt data=coco8.yaml epochs=50 imgsz=640

# Train YOLOv8n
yolo train model=yolov8n.pt data=coco8.yaml epochs=50 imgsz=640

Заключение

Оба YOLO11 и YOLOv8 представляют собой вершину технологий обнаружения объектов в реальном времени. YOLOv8 остается надежным и универсальным инструментом, идеально подходящим для общего назначения. Однако YOLO11 выходит за рамки, предлагая оптимизированную эффективность, что делает его рекомендуемой отправной точкой для новых проектов, особенно тех, которые нацелены на периферийные устройства или требуют максимально возможного соотношения точности и вычислительной мощности.

Разработчикам, стремящимся к абсолютной передовой производительности и архитектуре NMS, мы также рекомендуем ознакомиться с недавно выпущенным YOLO26. Он сочетает в себе лучшие черты предыдущих поколений с комплексной конструкцией, которая еще больше упрощает развертывание.

Изучите другие модели

  • YOLO26: новейшая ультрасовременная модель с сквозным обнаружением NMS и на 43 % более быстрым CPU .
  • RT-DETR: модель на основе трансформатора, обеспечивающая высокую точность, идеально подходит, когда скорость вывода заключений не так важна, как точность.
  • SAM : модель Meta Segment Anything, идеально подходящая для задач сегментации без обучения, когда данных для обучения недостаточно.

Комментарии