Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 против EfficientDet#

В быстро развивающейся области обнаружения объектов выбор оптимальной архитектуры нейронной сети имеет решающее значение для баланса между точностью, скоростью инференса и возможностью развертывания. Этот технический обзор сравнивает две высокоэффективные архитектуры: Ultralytics YOLOv8, универсальный стандарт в современной экосистеме компьютерного зрения, и EfficientDet, фундаментальную модель от Google, известную своей стратегией составного масштабирования.

Независимо от того, нацелено ли твое развертывание на высокопроизводительные облачные серверы или на периферийные устройства с ограниченными ресурсами, понимание архитектурных нюансов этих моделей поможет тебе добиться успеха в проекте.

Link to this sectionОбзор архитектуры#

Обе модели подходят к задаче идентификации и локализации объектов на изображении с использованием сверточных нейронных сетей, но они используют различные методологии для извлечения признаков и регрессии ограничивающих рамок.

Link to this sectionUltralytics YOLOv8#

Выпущенная компанией Ultralytics в январе 2023 года, модель YOLOv8 стала значительным шагом вперед в семействе YOLO. Созданная Гленном Джочером, Аюшем Чаурасией и Цзин Цю, она была разработана с нуля для беспрепятственной поддержки множества задач компьютерного зрения, включая обнаружение объектов, сегментацию экземпляров, оценку позы и классификацию изображений.

Архитектура представляет детектирующую голову без привязки к анкорам (anchor-free), что значительно сокращает количество предсказываемых рамок и ускоряет работу алгоритма подавления немаксимумов (NMS). Ее бэкбон использует новый модуль C2f (Cross-Stage Partial bottleneck с двумя свертками) для улучшения потока градиентов во время обучения при сохранении легковесности. Это делает YOLOv8 исключительно эффективной при компиляции в такие форматы, как NVIDIA TensorRT или ONNX.

Узнай больше о YOLOv8

Link to this sectionEfficientDet#

Созданная Минсин Таном, Руомингом Пангом и Куок В. Ле в Google и выпущенная в конце 2019 года, EfficientDet фокусируется на масштабируемой эффективности. Как описано в их официальной статье на Arxiv, модель активно использует экосистему AutoML.

Определяющей характеристикой EfficientDet является ее двунаправленная пирамидальная сеть признаков (BiFPN), которая обеспечивает простое и быстрое слияние признаков на нескольких масштабах. В сочетании с бэкбоном EfficientNet архитектура использует метод составного масштабирования, который одновременно и равномерно масштабирует разрешение, глубину и ширину всех сетей бэкбона, сети признаков и сетей предсказания рамок/классов. Хотя это приводит к отличной параметрической эффективности, сложная топология сети часто затрудняет достижение оптимальной скорости в реальном времени на стандартных GPU.

Узнай больше об EfficientDet

Link to this sectionСравнение производительности и метрик#

При сравнении детекторов объектов основными критериями являются средняя точность (mAP) и задержка инференса. В таблице ниже показано, как варианты YOLOv8 и семейство EfficientDet (d0-d7) соотносятся по стандартным метрикам на таких наборах данных, как COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
Анализ баланса производительности

В то время как EfficientDet достигает похвальной точности при меньшем теоретическом количестве операций FLOPs, Ultralytics YOLOv8 доминирует по скорости инференса на GPU в реальных условиях. Например, YOLOv8x достигает чуть более высокого показателя mAP (53.9), чем EfficientDet-d7 (53.7), но при этом обрабатывает изображения значительно быстрее на GPU T4 (14.37 мс против 128.07 мс), что делает YOLOv8 очевидным выбором для видеоналитики в реальном времени.

Link to this sectionМетодологии обучения и экосистема#

Опыт разработчика — важный фактор при выборе архитектуры машинного обучения. Именно здесь поддержка open-source сообщества и экосистема инструментов по-настоящему отличают эти модели.

EfficientDet сильно зависит от TensorFlow и специализированных конвейеров AutoML. Хотя это эффективно для крупномасштабного распределенного облачного обучения, настройка среды, корректировка анкоров и синтаксический анализ плотных конфигурационных файлов, которые можно найти в репозитории EfficientDet на GitHub, могут быть сложной задачей для динамичных инженерных команд.

Напротив, Ultralytics YOLOv8 изначально построена на PyTorch и предлагает непревзойденную простоту использования. Разработчики могут запускать сложные циклы обучения с помощью одной строки кода Python или команды CLI. Кроме того, требования к памяти модели во время обучения сильно оптимизированы; YOLOv8 позволяет разработчикам с бюджетными потребительскими GPU обучать надежные модели, не сталкиваясь с ошибками нехватки памяти (OOM), которые часто преследуют архитектуры с большим количеством блоков Transformer.

Бесшовная интеграция с платформой Ultralytics делает еще один шаг вперед, предоставляя интерфейс без необходимости написания кода для аннотирования наборов данных, обучения моделей и развертывания в облаке в один клик. Такие функции, как автоматическая настройка гиперпараметров, гарантируют, что ты всегда получишь наилучшую возможную точность для своих пользовательских наборов данных.

Link to this sectionПример кода Python: Инференс YOLOv8#

Запуск современного детектора с использованием репозитория Ultralytics на GitHub удивительно прост:

from ultralytics import YOLO

# Initialize the YOLOv8 model natively in PyTorch
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 example dataset
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on an image URL
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes
inference_results[0].show()

Link to this sectionСледующее поколение: Обновление до Ultralytics YOLO26#

Хотя YOLOv8 остается высокоэффективной производственной моделью, исследователям и разработчикам, стремящимся к передовым результатам в области ИИ, стоит обратить внимание на Ultralytics YOLO26, выпущенную в январе 2026 года.

YOLO26 переопределяет парадигму обнаружения объектов, внедряя оригинальный дизайн End-to-End NMS-Free (без NMS). Устранение необходимости в подавлении немаксимумов во время постобработки — «узком месте», существовавшем с ранних версий YOLO — практически исключает вариативность задержек. Это меняет правила игры для развертывания на маломощных устройствах.

Кроме того, YOLO26 включает в себя несколько новаторских инноваций в обучении:

  • Оптимизатор MuSGD: Вдохновленный передовыми методами обучения LLM, этот гибрид SGD и Muon обеспечивает высокую стабильность обучения и значительно ускоренные темпы сходимости.
  • До 43% быстрее инференс на CPU: Благодаря удалению NMS и сильно оптимизированному бэкбону, YOLO26 достигает беспрецедентных скоростей на периферийных устройствах только с CPU, не полагаясь на выделенные NPU.
  • ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметный скачок в точности распознавания мелких объектов, что делает YOLO26 незаменимой для аэрофотосъемки и точных IoT-датчиков.
  • Удаление DFL: Функция распределенных фокальных потерь (Distribution Focal Loss) была полностью удалена, чтобы радикально упростить процесс экспорта в такие форматы, как OpenVINO и CoreML.

Link to this sectionСценарии использования и рекомендации#

Выбор между этими архитектурами в конечном итоге зависит от твоих ограничений при развертывании и требований к устаревшим системам.

  • Выбирай Ultralytics YOLOv8, если: ты создаешь современные, универсальные приложения компьютерного зрения, требующие высокой точности, инференса GPU в реальном времени и беспроблемного опыта разработки. Ее высокая производительность в задачах классификации, сегментации и обнаружения делает ее мощным инструментом для розничной аналитики, робототехники и систем безопасности.
  • Выбирай EfficientDet, если: ты привязан к устаревшим рабочим процессам TensorFlow, а твоя главная забота — минимизация количества параметров и теоретических операций FLOPs, возможно, для исследовательских целей, а не для строгой промышленной эксплуатации в реальном времени.
  • Выбирай Ultralytics YOLO26, если: ты начинаешь новый проект и требуешь самого лучшего. Ее оригинальная архитектура end-to-end без NMS делает ее лучшим выбором как для сверхбыстрого развертывания на периферии, так и для тяжелой облачной обработки.

Если ты изучаешь другие высокоэффективные фреймворки в экосистеме Ultralytics, ты также можешь рассмотреть Ultralytics YOLO11 для сбалансированной производительности или RT-DETR для подхода к обнаружению в реальном времени на основе трансформеров.

Контрибьюторы

Комментарии