YOLO26 против EfficientDet: архитектура, производительность и варианты использования
Ландшафт обнаружения объектов значительно изменился за последнее десятилетие. Две заметные архитектуры, сформировавшие эту область, это Ultralytics YOLO26 и Google's EfficientDet. В то время как EfficientDet в 2019 году представил масштабируемый и эффективный способ обработки многомасштабных признаков, YOLO26 представляет собой передовую технологию компьютерного зрения в реальном времени в 2026 году, предлагая сквозную обработку и превосходную скорость на периферийных устройствах.
Это руководство предоставляет подробное техническое сравнение, чтобы помочь разработчикам, исследователям и инженерам выбрать подходящую модель для своих приложений.
Обзор модели
Ultralytics YOLO26
Выпущенный в январе 2026 года, YOLO26 является последней итерацией в известном семействе YOLO (You Only Look Once). Он представляет собой нативную сквозную архитектуру без NMS, которая упрощает конвейеры развёртывания, устраняя необходимость в постобработке с подавлением немаксимумов (NMS). Разработанный для экстремальной эффективности, он превосходно проявляет себя в сценариях периферийных вычислений, предлагая значительное ускорение на CPU без ущерба для точности.
Основные авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата выпуска: 2026-01-14
Лицензия:AGPL-3.0 (Доступна корпоративная версия)
Google EfficientDet
EfficientDet был предложен командой Google Brain (ныне Google DeepMind) в конце 2019 года. Он сосредоточен на эффективности и масштабируемости, используя метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину базовой сети, сети признаков и сети предсказаний. Его ключевым нововведением стала двунаправленная пирамида признаков (BiFPN), которая обеспечивает простое и быстрое слияние многомасштабных признаков.
Основные авторы: Минсин Тан, Руоминг Пан и Куок В. Ле
Организация: Google
Дата выпуска: 2019-11-20
Лицензия: Apache 2.0
Сравнение производительности
При сравнении этих двух архитектур наиболее заметное различие заключается в скорости инференса и сложности развёртывания. В то время как EfficientDet установил эталоны эффективности в 2019 году, YOLO26 использует современные оптимизации, чтобы значительно превзойти его, особенно при инференсе на CPU, что критически важно для периферийного развёртывания.
В таблице ниже представлены метрики производительности на наборе данных COCO. Обратите внимание на существенное преимущество в скорости серии YOLO26.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Контекст бенчмаркинга
Метрика Speed CPU ONNX особенно важна для реальных приложений на стандартном оборудовании. YOLO26n достигает замечательной задержки в 38.9 мс, что делает его пригодным для обработки видео в реальном времени на неакселерированных устройствах. Напротив, более высокие итерации EfficientDet страдают от высокой задержки, что делает их менее подходящими для обработки живых потоков.
Углубленное изучение архитектуры
Инновации YOLO26
YOLO26 представляет собой отход от традиционной логики обнаружения на основе якорей, присущей более ранним моделям.
- Сквозная логика без NMS: Традиционные детекторы, такие как EfficientDet, требуют подавления немаксимумов (NMS) для фильтрации перекрывающихся ограничивающих рамок. Этот шаг является вычислительно затратным и трудным для оптимизации на аппаратных ускорителях. YOLO26 полностью исключает это, предсказывая точный набор объектов напрямую.
- Оптимизатор MuSGD: Вдохновлённый обучением больших языковых моделей (LLM), YOLO26 использует гибридный оптимизатор, сочетающий SGD и Muon. Это приводит к более стабильной динамике обучения и более быстрой сходимости при обучении пользовательских моделей.
- Удаление DFL: Удаление Distribution Focal Loss (DFL) упрощает архитектуру модели. Это снижение сложности напрямую приводит к более высокой скорости инференса и более простому экспорту в форматы, такие как ONNX и TensorRT.
- ProgLoss + STAL: Внедрение Progressive Loss Balancing и Small-Target-Aware Label Assignment значительно повышает производительность при обнаружении мелких объектов, что является исторической проблемой для одностадийных детекторов.
Архитектура EfficientDet
EfficientDet построен на основе EfficientNet и представляет BiFPN (двунаправленную пирамиду признаков).
- Комплексное масштабирование: EfficientDet масштабирует разрешение, ширину и глубину одновременно, используя составной коэффициент (phi). Это позволяет пользователям систематически балансировать точность и ресурсы от D0 до D7.
- BiFPN: В отличие от стандартной FPN, BiFPN позволяет информации течь как сверху вниз, так и снизу вверх, и использует обучаемые веса для определения важности различных входных признаков.
- На основе якорей: EfficientDet опирается на набор заранее определенных якорных боксов, что требует тщательной настройки соотношений сторон и масштабов для оптимальной производительности на пользовательских наборах данных.
Удобство использования и экосистема
Одним из определяющих различий между использованием YOLO26 и EfficientDet является программная экосистема, окружающая их.
Опыт Ultralytics
Ultralytics отдает приоритет простоте использования и унифицированному API. Независимо от того, выполняете ли вы обнаружение объектов, сегментацию экземпляров, оценку позы или ориентированное обнаружение объектов (obb), синтаксис остается единообразным.
- Простой Python API: Обучение модели занимает всего несколько строк кода.
- Универсальность: YOLO26 изначально поддерживает несколько задач. EfficientDet — это в первую очередь детектор объектов, хотя сегментационные головы могут быть добавлены с помощью пользовательских реализаций.
- Готовность к развертыванию: Экосистема Ultralytics включает встроенную поддержку экспорта в CoreML, TFLite, OpenVINO и другие форматы, что упрощает путь от исследований к производству.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Экосистема EfficientDet
Доступ к EfficientDet обычно осуществляется через TensorFlow Object Detection API или различные реализации PyTorch. Хотя эти фреймворки мощны, они часто требуют больше шаблонного кода, сложных файлов конфигурации и имеют более крутую кривую обучения для новичков. Эффективное обучение на пользовательских данных часто требует значительной настройки гиперпараметров по сравнению с готовностью моделей YOLO к работе "из коробки".
Рекомендации по вариантам использования
Когда выбирать YOLO26
YOLO26 является идеальным выбором для большинства современных приложений компьютерного зрения, в частности:
- Граничные вычисления: Если вы развертываете на Raspberry Pi, мобильных устройствах (iOS/Android) или NVIDIA Jetson, ускорение вывода на CPU до 43% делает YOLO26 превосходящим.
- Видео в реальном времени: Для приложений, требующих высокой частоты кадров (FPS), таких как автономное вождение или видеонаблюдение, низкая задержка YOLO26 критически важна.
- Сложные задачи: Если ваш проект включает не только обнаружение, но также оценку позы или сегментацию, использование единого унифицированного фреймворка снижает накладные расходы на разработку.
- Быстрое прототипирование: Активное сообщество и обширная документация позволяют разработчикам быстро итерировать.
Когда стоит рассмотреть EfficientDet
Хотя в целом EfficientDet медленнее, он по-прежнему актуален в определенных исследовательских контекстах:
- Академические исследования: Если вы изучаете именно пирамидальные сети признаков, архитектура BiFPN остается ценным ориентиром.
- Устаревшие системы: Существующие конвейеры, тесно интегрированные со старыми версиями TensorFlow, могут обнаружить, что проще поддерживать существующую модель EfficientDet, чем мигрировать.
Заключение
В то время как EfficientDet представил новаторские концепции в слиянии признаков и масштабировании моделей, YOLO26 представляет собой следующее поколение ИИ для зрения. Благодаря своей сквозной NMS-free архитектуре, превосходным скоростям вывода и более низким требованиям к памяти, YOLO26 предлагает более практичное и мощное решение для современных задач ИИ.
Для разработчиков, стремящихся создавать надежные приложения реального времени, оптимизированный рабочий процесс и баланс производительности Ultralytics YOLO26 делают его очевидной рекомендацией.
Дополнительная литература
Изучите другие модели в документации Ultralytics:
- YOLO11: Передовая модель предыдущего поколения.
- YOLOv10: Пионер обучения без NMS.
- RT-DETR: Real-time DEtection TRansformer, еще один отличный сквозной вариант.