Перейти к содержанию

YOLO26 против EfficientDet: Техническое сравнение современных архитектур обнаружения объектов

Выбор правильной архитектуры нейронной сети критически важен для успеха любого приложения компьютерного зрения. В этом техническом руководстве рассматриваются компромиссы, метрики производительности и архитектурные инновации двух выдающихся моделей: передовой Ultralytics YOLO26 и хорошо зарекомендовавшей себя EfficientDet от Google.

Независимо от того, нацелено ли ваше развертывание на высокопроизводительные облачные серверы или периферийные ИИ-устройства с ограничениями по задержке, понимание различий между этими архитектурами обеспечивает оптимальный баланс скорости, точности и эффективности.

Архитектурный обзор: YOLO26

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2026-01-14
GitHub:GitHub Ultralytics
Документация:Официальная документация YOLO26

Выпущенный в начале 2026 года, YOLO26 представляет собой новейшую эволюцию в семействе YOLO, специально разработанную для обеспечения беспрецедентного пользовательского опыта и первоклассной средней точности (mAP). Разработанный с нуля для современного оборудования, он предлагает исключительную универсальность в обнаружении объектов, сегментации экземпляров, классификации изображений и оценке позы.

YOLO26 представляет несколько новаторских функций, которые значительно улучшают как стабильность обучения, так и скорость инференции:

  • Сквозная архитектура без NMS: Основываясь на концепциях, впервые примененных в YOLOv10, YOLO26 изначально является сквозной, полностью устраняя необходимость в постобработке Non-Maximum Suppression (NMS). Это приводит к упрощению логики развертывания и значительному снижению вариативности задержки.
  • До 43% более быстрый инференс на CPU: Благодаря глубоким архитектурным оптимизациям модель достигает беспрецедентных скоростей инференса на стандартных CPU, что делает ее очень подходящей для IoT и встраиваемых сред.
  • Удаление DFL: Distribution Focal Loss был удален, что привело к более чистому процессу экспорта и улучшенной совместимости с маломощными периферийными устройствами, использующими такие инструменты, как ONNX.
  • Оптимизатор MuSGD: Вдохновленный процедурами обучения LLM модели Kimi K2 от Moonshot AI, этот гибрид SGD и Muon переносит инновации в обучении больших языковых моделей непосредственно в компьютерное зрение, обеспечивая более быструю сходимость и более стабильные режимы обучения.
  • ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что является критическим фактором для приложений, использующих аэрофотоснимки с дронов, и робототехники.

Оптимизированный экспорт

Благодаря удалению DFL и архитектуре без NMS, экспорт моделей YOLO26 в форматы, оптимизированные для периферийных устройств, такие как NVIDIA TensorRT или Intel OpenVINO, практически не требует разработки пользовательских плагинов.

Узнайте больше о YOLO26

Архитектурный обзор: EfficientDet

Авторы: Минсин Тан, Руомин Пан и Куок В. Ле
Организация:Google Research
Дата: 20.11.2019
Arxiv:Статья EfficientDet
GitHub:Репозиторий Google AutoML

Представленный Google, EfficientDet активно использует экосистему TensorFlow и был разработан на основе концепции составного масштабирования. Его архитектура одновременно масштабирует базовую сеть (backbone), сеть признаков и сети предсказания ограничивающих рамок/классов в зависимости от ресурсных ограничений.

Ключевые нововведения EfficientDet включают:

  • BiFPN (двунаправленная пирамидальная сеть признаков): Механизм, обеспечивающий простое и быстрое слияние многомасштабных признаков, что позволяет сети лучше распознавать объекты различных размеров.
  • Составное масштабирование: Эвристический метод для равномерного масштабирования разрешения, глубины и ширины, создающий семейство моделей от d0 (наименьшая) до d7 (наибольшая).

Хотя EfficientDet остается надежным выбором для строгого детектирования ограничивающих рамок, ему, как правило, не хватает современной многозадачной универсальности (например, нативных задач OBB) и оптимизированной, унифицированной экосистемы Python, которую ожидают современные разработчики.

Узнайте больше об EfficientDet

Сравнение производительности и метрик

Чтобы определить границу Парето между скоростью и точностью, мы протестировали обе архитектуры в стандартных средах, используя набор данных COCO. В следующей таблице показаны различия в размерах моделей, точности и задержке, измеренные на экземпляре AWS EC2 P4d.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Как показано выше, YOLO26 устанавливает превосходный баланс производительности. Модель YOLO26x достигает наивысшей точности (57.5 mAP), значительно превосходя самый тяжёлый EfficientDet-d7. Кроме того, модели YOLO26 демонстрируют существенно более низкие требования к памяти и гораздо более высокую скорость вывода на GPU (всего 1.7 мс на TensorRT), подчёркивая преимущества дизайна без NMS.

Эффективность обучения и преимущество экосистемы

Основное различие между двумя архитектурами заключается в их средах разработки. EfficientDet глубоко интегрирован в экосистему Google AutoML и TensorFlow, которая, будучи мощной, может создавать крутые кривые обучения и жесткие конфигурации для пользовательских наборов данных, таких как DOTAv1.

Напротив, Ultralytics предлагает невероятно хорошо поддерживаемую экосистему, построенную на PyTorch. Использование памяти во время обучения строго оптимизировано, что позволяет инженерам обучать надежные модели без чрезмерных выделений VRAM, характерных для сетей на основе трансформеров.

Единая интеграция платформы

Через платформу Ultralytics разработчики получают доступ к сквозному рабочему процессу MLOps. Это включает бесшовную аннотацию данных, автоматическую настройку гиперпараметров и обучение в облаке одним кликом, что значительно ускоряет путь от прототипирования до производства.

Пример реализации

Простота использования, обеспечиваемая Ultralytics API, означает, что вы можете обучить и проверить современную модель YOLO26 всего в нескольких строках кода.

from ultralytics import YOLO

# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")

# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Train on GPU
)

# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")

Идеальные варианты использования

Когда использовать YOLO26:

  • Периферийные вычисления и мобильные устройства: Благодаря до 43% более быстрому инференсу на CPU и отсутствию накладных расходов NMS, YOLO26 превосходно работает на устройствах со строго ограниченными вычислительными ресурсами, таких как Raspberry Pi или мобильные телефоны.
  • Многозадачность: Когда один конвейер требует ограничивающих рамок, масок сегментации и tracking, универсальность YOLO26 не имеет себе равных.
  • Аэрофотосъемка и съемка с дронов: Комбинация ProgLoss и STAL значительно улучшает detect чрезвычайно малых объектов с больших высот.

Когда использовать EfficientDet:

  • Устаревшие конвейеры TensorFlow: Если ваша инфраструктура жестко закодирована для поддержки только TensorFlow SavedModels или требует специфических конвейеров TensorFlow Serving, EfficientDet обеспечивает нативную совместимость.
  • TPU с ограниченными ресурсами: EfficientDet был значительно оптимизирован для специализированных тензорных процессоров Google (TPUs).

Исследование других альтернатив

Хотя это руководство в значительной степени сосредоточено на парадигме YOLO26 против EfficientDet, более широкая экосистема Ultralytics содержит другие невероятные архитектуры. Если ваше приложение сильно зависит от трансформеров, RT-DETR предлагает detect на основе трансформеров в реальном времени. В качестве альтернативы, если вы поддерживаете устаревшие системы, YOLO11 остается полностью поддерживаемым и высокоэффективным. Для более широкого обзора посетите Центр сравнения моделей Ultralytics.

В конечном итоге, для любого современного конвейера компьютерного зрения, создаваемого сегодня, исключительная скорость, простота использования и передовая точность YOLO26 делают его бесспорной рекомендацией как для исследователей, так и для разработчиков.


Комментарии