EfficientDet против YOLO26: Глубокий анализ архитектур обнаружения объектов

В период с 2019 по 2026 год область компьютерного зрения претерпела значительные изменения. В то время как EfficientDet представил миру концепцию оптимизации масштабируемой архитектуры, YOLO26 с его сквозной архитектурой представляет собой вершину современной эффективности в режиме реального времени. В этом сравнении рассматриваются архитектурные изменения, показатели производительности и практические применения этих двух влиятельных моделей, что помогает разработчикам выбрать подходящий инструмент для своих конкретных задач по обнаружению объектов.

Сравнение метрик производительности

В следующей таблице сравниваются характеристики вариантов EfficientDet и семейства YOLO26. Обратите внимание на значительный скачок в скорости вывода и эффективности параметров, достигнутый благодаря новой архитектуре.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

EfficientDet: масштабируемый пионер

Разработанный командой Google , EfficientDet был выпущен в конце 2019 года и быстро установил новый стандарт эффективности. Основной инновацией стал метод Compound Scaling, который равномерно масштабирует разрешение, глубину и ширину магистрали сети (EfficientNet) и сети характеристик/сети прогнозирования.

Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
Организация:Google
Дата: 2019-11-20
Arxiv:EfficientDet: Масштабируемое и эффективное обнаружение объектов
GitHub:google/automl/efficientdet

Ключевые архитектурные особенности

EfficientDet использует двунаправленную пирамидальную сеть (BiFPN). В отличие от традиционных FPN, которые суммируют характеристики только по принципу «сверху вниз», BiFPN вводит обучаемые веса для различных входных характеристик и повторно применяет многомасштабное слияние характеристик по принципу «сверху вниз» и «снизу вверх». Хотя это обеспечивает высокую точность, сложные взаимосвязи могут быть вычислительно тяжелыми, особенно на устройствах без специализированных аппаратных ускорителей.

Сложность наследия

Несмотря на то, что на тот момент структура BiFPN была революционной, она предполагает нерегулярные схемы доступа к памяти, которые могут вызывать задержки на современном оборудовании Edge AI по сравнению с оптимизированными структурами CNN, используемыми в более новых моделях.

YOLO26: скоростной демон от начала до конца

Выпущенный в начале 2026 года, YOLO26 переопределяет возможности периферийных устройств. Он отходит от логики, основанной на якорях, которая использовалась в прошлом, и переходит к упрощенной сквозной архитектуре, которая устраняет необходимость в сложных этапах постобработки, таких как подавление не максимальных значений (NMS).

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2026-01-14
GitHub:ultralytics/ultralytics
Документация:ДокументацияUltralytics

Узнайте больше о YOLO26

Технические прорывы в YOLO26

YOLO26 объединяет в себе несколько передовых достижений, которые отличают его от предшественников и конкурентов, таких как EfficientDet:

Сквозной дизайн NMS: благодаря устранению NMS YOLO26 упрощает конвейер вывода. Это снижает изменчивость задержки и упрощает развертывание на таких чипах, как TensorRT или CoreML более плавным.
MuSGD Optimizer: вдохновленный обучением больших языковых моделей (LLM), этот гибрид SGD Muon (из Moonshot AI's Kimi K2) обеспечивает стабильную динамику обучения и более быструю конвергенцию, сокращая GPU часов, необходимых для тонкой настройки.
ProgLoss + STAL: Внедрение программируемых потерь и потерь при назначении мягких целей значительно улучшает обнаружение небольших объектов, что традиционно является слабым местом одноступенчатых детекторов.
Оптимизация Edge-First: удаление Distribution Focal Loss (DFL) упрощает граф модели, что способствует увеличению скорости CPU до 43 % по сравнению с предыдущими поколениями.

Подробное сравнение

Архитектура и эффективность

EfficientDet опирается на мощную основу EfficientNet и сложное объединение BiFPN. Хотя это обеспечивает высокую точность по каждому параметру, сырые FLOP не всегда линейно влияют на скорость вывода из-за затрат на доступ к памяти.

В отличие от этого, YOLO26 разработан для обеспечения пропускной способности. Его архитектура минимизирует использование пропускной способности памяти, что является критически важным фактором для мобильных устройств и устройств Интернета вещей. Модель «Nano» (YOLO26n) работает с поразительной скоростью 1,7 мс на GPU T4 по сравнению с 3,92 мс для EfficientDet-d0, при этом достигая значительно более высокой точности (40,9 mAP 34,6 mAP).

Обучение и удобство использования

Одно из наиболее значительных отличий заключается в экосистеме. Обучение EfficientDet часто требует навигации по сложным репозиториям исследований или старым кодовым базам TensorFlow .x/2.x.

Ultralytics предлагает беспроблемный опыт «Zero-to-Hero». С помощью Ultralytics пользователи могут управлять наборами данных, обучаться в облаке и развертывать решения одним щелчком мыши. Python разработан с учетом простоты использования:

from ultralytics import YOLO

# Load a pre-trained YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

Универсальность и задачи

EfficientDet — это в первую очередь модель обнаружения объектов. Хотя существуют расширения, они не стандартизированы. YOLO26, однако, является многозадачным мощным инструментом. Он изначально поддерживает:

Сегментация экземпляров: точное маскирование объектов с оптимизированными потерями семантической сегментации.
Оценка позы: использование оценки остаточной логарифмической вероятности (RLE) для точного определения ключевых точек.
Ориентированная ограничивающая рамка (OBB): Специализированная угловая потеря для обнаружения повернутых объектов, таких как корабли или текст.
Классификация: высокоскоростная классификация изображений.

Эффективность памяти

Модели YOLO26, как правило, требуют меньше CUDA во время обучения по сравнению со старыми архитектурами или гибридными моделями на основе трансформаторов, что позволяет использовать более крупные пакеты данных на потребительском оборудовании.

Почему стоит выбрать Ultralytics YOLO26?

Для разработчиков и исследователей в 2026 году выбор очевиден. Хотя EfficientDet остается важной вехой в истории компьютерного зрения, YOLO26 предлагает более совершенное современное решение.

Простота использования: обширная документация и простой API снижают барьер для входа.
Баланс производительности: достигает «золотого соотношения» высокой точности и скорости в реальном времени, что крайне важно для таких приложений, как автономное вождение и охранное наблюдение.
Хорошо поддерживаемая экосистема: частые обновления, поддержка сообщества через Discord и беспроблемная интеграция с такими инструментами, как Ultralytics и Weights & Biases гарантируют, что ваш проект будет актуален и в будущем.
Готовность к развертыванию: с поддержкой нативного экспорта в ONNX, OpenVINOи CoreML переход от прототипа к производству не представляет никаких сложностей.

Для пользователей, заинтересованных в других высокопроизводительных вариантах из Ultralytics , предыдущее поколение YOLO11 остается надежным выбором, а RT-DETR предлагает отличные возможности на основе преобразователя для сценариев, в которых глобальный контекст имеет первостепенное значение.