EfficientDet против YOLO26: комплексное техническое сравнение
Выбор правильной архитектуры компьютерного зрения — критически важный шаг при создании масштабируемых и эффективных систем ИИ. Это подробное руководство содержит глубокое техническое сравнение устаревшей модели EfficientDet от Google и передовой Ultralytics YOLO26. Мы оцениваем их базовые архитектуры, показатели производительности и методологии обучения, чтобы помочь тебе выбрать лучшую модель для твоих конкретных ограничений развертывания.
Происхождение моделей и авторы
Понимание истоков этих архитектур дает ценный контекст касательно философии их проектирования и предполагаемых сценариев использования.
EfficientDet
Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google Research
Дата: 20.11.2019
Arxiv: 1911.09070
GitHub: google/automl/efficientdet
YOLO26
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 14.01.2026
GitHub: ultralytics/ultralytics
Архитектурные инновации
Различия в архитектуре между этими двумя моделями существенны, что отражает стремительный прогресс в области глубокого обучения за последние несколько лет.
EfficientDet была построена на основе BiFPN (двунаправленная пирамидальная сеть признаков) и использует метод составного масштабирования по разрешению, глубине и ширине. Хотя в 2019 году она достигла отличной теоретической эффективности, модель сильно зависит от устаревших фреймворков TensorFlow и сложных алгоритмов поиска AutoML, которые часто затруднительно адаптировать под пользовательские наборы данных.
В отличие от нее, Ultralytics YOLO26 представляет собой абсолютный передний край технологий компьютерного зрения в реальном времени. В ней представлено несколько революционных архитектурных улучшений, разработанных специально для современных конвейеров развертывания:
- Сквозной дизайн без NMS: YOLO26 является нативно сквозной моделью, полностью исключающей необходимость постобработки методом подавления немаксимумов (NMS). Этот прорывной подход, впервые примененный в YOLOv10, обеспечивает более быструю и простую логику развертывания, а также значительно снижает вариативность задержек на периферийных чипах.
- Удаление DFL: Удалив функцию потерь распределения (DFL), YOLO26 упростила выходной слой, что привело к превосходной совместимости с периферийными вычислениями и маломощными устройствами.
- Оптимизатор MuSGD: Вдохновленная инновациями больших языковых моделей, такими как Kimi K2 от Moonshot AI, модель YOLO26 использует оптимизатор MuSGD — гибрид SGD и Muon. Это обеспечивает значительно более стабильное обучение и более быструю сходимость по сравнению со стандартными оптимизаторами.
- ProgLoss + STAL: Внедрение прогрессивных функций потерь в сочетании с обучением, ориентированным на задачи с учетом масштаба (STAL), обеспечивает заметные улучшения в распознавании мелких объектов, что крайне важно для аэросъемки и робототехники.
Метрики производительности и бенчмарки
Настоящая проверка любой модели детектирования объектов заключается в ее производительности в реальных условиях. В таблице ниже точность, измеряемая в средней точности (mAP), сравнивается со скоростью логического вывода и вычислительными требованиями.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Как показано выше, YOLO26 предлагает значительно лучший баланс производительности. Хотя старые архитектуры могут иногда демонстрировать низкие теоретические показатели FLOPs, YOLO26 использует оптимизированные шаблоны доступа к памяти для достижения значительно более быстрого логического вывода на GPU. Например, YOLO26x достигает невероятных 57.5 mAP, работая почти в 10 раз быстрее на оборудовании TensorRT, чем эквивалентная EfficientDet-d7. Кроме того, YOLO26 оснащена оптимизациями, которые обеспечивают до 43% более быстрый логический вывод на CPU по сравнению с устаревшими вариантами YOLO, что делает ее лучшим выбором для Edge AI.
Преимущество экосистемы Ultralytics
Выбор архитектуры редко сводится только к теоретическим FLOPs; он сильно зависит от инженерных рабочих процессов. Разработчики постоянно отдают предпочтение Ultralytics из-за непревзойденной простоты использования.
Обучение EfficientDet часто требует сложного управления зависимостями, ручной настройки гиперпараметров и устаревших настроек TensorFlow. И наоборот, модели Ultralytics имеют элегантно простой API. Этот бесшовный опыт напрямую переносится на платформу Ultralytics, которая берет на себя облачное обучение, разметку данных и отслеживание экспериментов в реальном времени прямо «из коробки».
Более того, детекторы на базе трансформеров и сложные модели AutoML страдают от непомерного потребления памяти. Модели Ultralytics славятся своими крайне эффективными требованиями к памяти, что означает, что ты можешь обучать надежные модели на потребительском оборудовании, не сталкиваясь с ошибками нехватки памяти (OOM).
Универсальность и поддержка задач
EfficientDet — это строго сеть для детектирования объектов. YOLO26 — это универсальный мультизадачный ученик. Она включает в себя специфические инновации, изначально встроенные в архитектуру:
- Функция потерь семантической сегментации и мультимасштабные прототипы для безупречной инстанс-сегментации.
- Оценка остаточного логарифмического правдоподобия (RLE) для значительного повышения точности оценки позы.
- Специализированные процедуры учета угловых потерь для решения проблем границ в ориентированных ограничивающих рамках (OBB).
Если ты поддерживаешь старые системы, Ultralytics по-прежнему полностью поддерживает YOLO11 и более старые итерации в рамках того же API. Однако для всех новых разработок YOLO26 обеспечивает лучшую отдачу от соотношения ресурсов к точности.
Варианты использования и рекомендации
Выбор между EfficientDet и YOLO26 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.
Когда выбирать EfficientDet
EfficientDet — это хороший выбор для:
- Конвейеров Google Cloud и TPU: Систем, глубоко интегрированных с API Google Cloud Vision или инфраструктурой TPU, где EfficientDet имеет нативную оптимизацию.
- Исследований в области составного масштабирования: Академических бенчмарков, сфокусированных на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
- Развертывания на мобильных устройствах через TFLite: Проектов, которые специально требуют экспорта в TensorFlow Lite для Android или встроенных Linux-устройств.
Когда выбирать YOLO26
YOLO26 рекомендуется для:
- Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.
Пример реализации: Обучение YOLO26
Благодаря Python SDK от Ultralytics для запуска высокооптимизированного обучения требуется всего несколько строк кода. Фреймворк нативно поддерживает масштабирование со смешанной точностью, оркестрацию с использованием нескольких GPU через PyTorch и конвейеры аугментации.
from ultralytics import YOLO
# Load the lightweight, end-to-end YOLO26n model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset leveraging the robust MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Automatically engages GPU acceleration
)
# Export natively to ONNX without NMS plugins
exported_path = model.export(format="onnx")
print(f"Model seamlessly exported to: {exported_path}")Заключение: какую модель выбрать?
При сравнении EfficientDet и YOLO26 траектория развития отрасли очевидна. EfficientDet остается важной исторической вехой в исследованиях составного масштабирования. Однако для современных приложений — будь то развертывание в облачных кластерах или на устройствах с ограничениями, таких как Raspberry Pi — выбор сильно склоняется в сторону Ultralytics.
Исключив NMS, оптимизировав модель для значительно меньшего потребления VRAM и обернув технологию в экосистему разработчиков мирового класса, YOLO26 определенно является рекомендованной архитектурой для надежного компьютерного зрения, готового к производству. Независимо от того, обнаруживаешь ли ты производственные дефекты или оцениваешь урожайность в сельском хозяйстве, платформа Ultralytics гарантирует, что ты перейдешь от набора данных к развертыванию с непревзойденной скоростью и точностью.