Link to this sectionYOLO11 против EfficientDet: всестороннее техническое сравнение#
Выбор оптимальной нейронной сети для проектов по компьютерному зрению требует глубокого понимания доступных архитектур. В этом руководстве представлено подробное техническое сравнение Ultralytics YOLO11 и EfficientDet от Google. Мы разберем архитектурные различия, метрики производительности, эффективность обучения и идеальные сценарии развертывания, чтобы помочь тебе принять взвешенное решение для твоих задач по машинному обучению.
Link to this sectionПредыстория и характеристики моделей#
Обе модели оказали значительное влияние на ландшафт глубокого обучения, хотя они и основаны на разных дизайнерских философиях и относятся к разным этапам развития ИИ.
Link to this sectionДетали YOLO11#
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/
Link to this sectionПодробности об EfficientDet#
Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google
Дата: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Документация: https://github.com/google/automl/tree/master/efficientdet#readme
При работе с моделями компьютерного зрения окружающая экосистема так же важна, как и сама модель. Экосистема Ultralytics обеспечивает непревзойденный опыт для разработчиков, предлагая обширную документацию, активную поддержку сообщества и бесшовные возможности экспорта в такие форматы, как ONNX и TensorRT.
Link to this sectionАрхитектурные инновации#
Link to this sectionEfficientDet: BiFPN и составное масштабирование#
Представленная в конце 2019 года, EfficientDet стремилась максимизировать точность при минимизации вычислительных затрат. Это достигается главным образом с помощью двух механизмов. Во-первых, используется backbone EfficientNet, который масштабирует глубину, ширину и разрешение согласованно. Во-вторых, была представлена двунаправленная пирамидальная сеть признаков (BiFPN), позволяющая легко и быстро осуществлять слияние признаков на разных масштабах.
Хотя EfficientDet была весьма эффективна для своего времени, зависимость от библиотеки AutoML в TensorFlow может сделать её довольно неповоротливой. Исследователи часто сталкиваются с трудностями при прунинге моделей и внесении пользовательских изменений по сравнению с современными модульными фреймворками на базе PyTorch.
Link to this sectionYOLO11: улучшенное извлечение признаков и универсальность#
YOLO11 представляет собой значительный скачок вперед в архитектурах обнаружения объектов. Она опирается на успехи своих предшественников, внедряя доработанные блоки C3k2 и улучшенный модуль Spatial Pyramid Pooling. Эти улучшения обеспечивают превосходное извлечение признаков, позволяя YOLO11 фиксировать сложные визуальные закономерности с исключительной четкостью.
Главное преимущество YOLO11 — это ее универсальность. В то время как EfficientDet является исключительно моделью для обнаружения объектов, YOLO11 нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Кроме того, YOLO11 может похвастаться невероятно низкими требованиями к памяти как при обучении, так и при инференсе, что делает ее намного лучше старых моделей и громоздких визуальных трансформеров при развертывании в средах Edge AI с ограниченными ресурсами.
Link to this sectionПроизводительность и бенчмарки#
Баланс между точностью, измеряемой в mean Average Precision (mAP), и скоростью инференса является решающим фактором для реальных проектов. В таблице ниже показана базовая производительность обеих семейств моделей на стандартном датасете COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Как видно, YOLO11 достигает крайне выгодного баланса производительности. YOLO11x демонстрирует наивысшую общую точность (54.7 mAP), в то время как более компактные варианты YOLO11 абсолютно доминируют по скорости инференса на GPU (до 1.5 мс на T4 с использованием TensorRT).
Link to this sectionЭффективность обучения и экосистема#
Одна из определяющих характеристик моделей Ultralytics — это их простота использования. Обучение модели EfficientDet часто требует разбора сложных конфигураций графов TensorFlow и управления запутанными цепочками зависимостей. Напротив, YOLO11 построена на чистом, современном фундаменте PyTorch.
Эта хорошо поддерживаемая экосистема означает, что ты можешь установить пакет, загрузить предобученную модель и начать обучение на своем датасете всего за несколько строк кода.
Link to this sectionПример кода на Python#
Вот полностью рабочий пример, демонстрирующий простоту API Ultralytics. Этот скрипт загружает предобученную модель YOLO11, обучает её и выполняет быстрое предсказание.
from ultralytics import YOLO
# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")
# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")
# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the output bounding boxes
prediction[0].show()Link to this sectionВзгляд в будущее: преимущество YOLO26#
Хотя YOLO11 исключительно мощна, командам, начинающим новые проекты с нуля, стоит серьезно рассмотреть Ultralytics YOLO26, выпущенную в январе 2026 года. YOLO26 представляет собой смену парадигмы в простоте развертывания и производительности на периферийных устройствах.
Ключевые инновации YOLO26 включают:
- Конструкция End-to-End без NMS: Исключая немаксимальное подавление (NMS) при постобработке, YOLO26 обеспечивает стабильную, сверхнизкую задержку, что критически важно для высокоскоростной робототехники и автономного вождения.
- До 43% быстрее при инференсе на CPU: Для развертываний, где отсутствуют выделенные GPU, YOLO26 специально оптимизирована для максимизации пропускной способности на стандартных процессорах.
- Оптимизатор MuSGD: Вдохновленный Kimi K2 от Moonshot AI, этот гибридный оптимизатор привносит стабильность обучения LLM в компьютерное зрение, обеспечивая более быструю сходимость.
- ProgLoss + STAL: Эти улучшенные функции потерь кардинально улучшают распознавание мелких объектов, что часто является «болевой точкой» при анализе спутниковых снимков и кадров с дронов.
- Удаление DFL: Удаление Distribution Focal Loss упрощает процесс экспорта модели на периферийные устройства.
Link to this sectionСценарии использования и рекомендации#
Выбор между YOLO11 и EfficientDet зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать YOLO11#
YOLO11 — отличный выбор для:
- Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
- Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
- Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.
Link to this sectionКогда стоит выбрать EfficientDet#
EfficientDet рекомендуется для:
- Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
- Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
- Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionЗаключение#
EfficientDet была новаторской архитектурой, доказавшей жизнеспособность составного масштабирования при обнаружении объектов. Однако стремительный темп исследований в области ИИ привел к появлению моделей, которые просто более функциональны, легче интегрируются и работают быстрее.
Благодаря мощным возможностям для решения нескольких задач, невероятной скорости инференса на GPU и, возможно, самому дружелюбному API для разработчиков в индустрии, YOLO11 является очевидным победителем для современных конвейеров компьютерного зрения. Для тех, кто нацелен на передовой край технологий — особенно при работе с edge-устройствами — переход на YOLO26 обеспечит лучшее сочетание скорости без NMS и непревзойденной точности.