Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 против EfficientDet: всестороннее техническое сравнение#

Выбор оптимальной нейронной сети для проектов по компьютерному зрению требует глубокого понимания доступных архитектур. В этом руководстве представлено подробное техническое сравнение Ultralytics YOLO11 и EfficientDet от Google. Мы разберем архитектурные различия, метрики производительности, эффективность обучения и идеальные сценарии развертывания, чтобы помочь тебе принять взвешенное решение для твоих задач по машинному обучению.

Link to this sectionПредыстория и характеристики моделей#

Обе модели оказали значительное влияние на ландшафт глубокого обучения, хотя они и основаны на разных дизайнерских философиях и относятся к разным этапам развития ИИ.

Link to this sectionДетали YOLO11#

Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/

Узнай больше о YOLO11

Link to this sectionПодробности об EfficientDet#

Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google
Дата: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Документация: https://github.com/google/automl/tree/master/efficientdet#readme

Узнай больше об EfficientDet

Преимущества экосистемы

При работе с моделями компьютерного зрения окружающая экосистема так же важна, как и сама модель. Экосистема Ultralytics обеспечивает непревзойденный опыт для разработчиков, предлагая обширную документацию, активную поддержку сообщества и бесшовные возможности экспорта в такие форматы, как ONNX и TensorRT.

Link to this sectionАрхитектурные инновации#

Link to this sectionEfficientDet: BiFPN и составное масштабирование#

Представленная в конце 2019 года, EfficientDet стремилась максимизировать точность при минимизации вычислительных затрат. Это достигается главным образом с помощью двух механизмов. Во-первых, используется backbone EfficientNet, который масштабирует глубину, ширину и разрешение согласованно. Во-вторых, была представлена двунаправленная пирамидальная сеть признаков (BiFPN), позволяющая легко и быстро осуществлять слияние признаков на разных масштабах.

Хотя EfficientDet была весьма эффективна для своего времени, зависимость от библиотеки AutoML в TensorFlow может сделать её довольно неповоротливой. Исследователи часто сталкиваются с трудностями при прунинге моделей и внесении пользовательских изменений по сравнению с современными модульными фреймворками на базе PyTorch.

Link to this sectionYOLO11: улучшенное извлечение признаков и универсальность#

YOLO11 представляет собой значительный скачок вперед в архитектурах обнаружения объектов. Она опирается на успехи своих предшественников, внедряя доработанные блоки C3k2 и улучшенный модуль Spatial Pyramid Pooling. Эти улучшения обеспечивают превосходное извлечение признаков, позволяя YOLO11 фиксировать сложные визуальные закономерности с исключительной четкостью.

Главное преимущество YOLO11 — это ее универсальность. В то время как EfficientDet является исключительно моделью для обнаружения объектов, YOLO11 нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Кроме того, YOLO11 может похвастаться невероятно низкими требованиями к памяти как при обучении, так и при инференсе, что делает ее намного лучше старых моделей и громоздких визуальных трансформеров при развертывании в средах Edge AI с ограниченными ресурсами.

Link to this sectionПроизводительность и бенчмарки#

Баланс между точностью, измеряемой в mean Average Precision (mAP), и скоростью инференса является решающим фактором для реальных проектов. В таблице ниже показана базовая производительность обеих семейств моделей на стандартном датасете COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Как видно, YOLO11 достигает крайне выгодного баланса производительности. YOLO11x демонстрирует наивысшую общую точность (54.7 mAP), в то время как более компактные варианты YOLO11 абсолютно доминируют по скорости инференса на GPU (до 1.5 мс на T4 с использованием TensorRT).

Link to this sectionЭффективность обучения и экосистема#

Одна из определяющих характеристик моделей Ultralytics — это их простота использования. Обучение модели EfficientDet часто требует разбора сложных конфигураций графов TensorFlow и управления запутанными цепочками зависимостей. Напротив, YOLO11 построена на чистом, современном фундаменте PyTorch.

Эта хорошо поддерживаемая экосистема означает, что ты можешь установить пакет, загрузить предобученную модель и начать обучение на своем датасете всего за несколько строк кода.

Link to this sectionПример кода на Python#

Вот полностью рабочий пример, демонстрирующий простоту API Ultralytics. Этот скрипт загружает предобученную модель YOLO11, обучает её и выполняет быстрое предсказание.

from ultralytics import YOLO

# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")

# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the output bounding boxes
prediction[0].show()

Link to this sectionВзгляд в будущее: преимущество YOLO26#

Хотя YOLO11 исключительно мощна, командам, начинающим новые проекты с нуля, стоит серьезно рассмотреть Ultralytics YOLO26, выпущенную в январе 2026 года. YOLO26 представляет собой смену парадигмы в простоте развертывания и производительности на периферийных устройствах.

Ключевые инновации YOLO26 включают:

  • Конструкция End-to-End без NMS: Исключая немаксимальное подавление (NMS) при постобработке, YOLO26 обеспечивает стабильную, сверхнизкую задержку, что критически важно для высокоскоростной робототехники и автономного вождения.
  • До 43% быстрее при инференсе на CPU: Для развертываний, где отсутствуют выделенные GPU, YOLO26 специально оптимизирована для максимизации пропускной способности на стандартных процессорах.
  • Оптимизатор MuSGD: Вдохновленный Kimi K2 от Moonshot AI, этот гибридный оптимизатор привносит стабильность обучения LLM в компьютерное зрение, обеспечивая более быструю сходимость.
  • ProgLoss + STAL: Эти улучшенные функции потерь кардинально улучшают распознавание мелких объектов, что часто является «болевой точкой» при анализе спутниковых снимков и кадров с дронов.
  • Удаление DFL: Удаление Distribution Focal Loss упрощает процесс экспорта модели на периферийные устройства.
Альтернативные модели для изучения

Если у твоего проекта есть узкоспецифичные требования, возможно, стоит протестировать модель RT-DETR для обнаружения на основе трансформеров или широко распространенную YOLOv8, которая остается базовым решением во многих корпоративных проектах.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLO11 и EfficientDet зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда выбирать YOLO11#

YOLO11 — отличный выбор для:

  • Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
  • Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
  • Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.

Link to this sectionКогда стоит выбрать EfficientDet#

EfficientDet рекомендуется для:

  • Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
  • Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionЗаключение#

EfficientDet была новаторской архитектурой, доказавшей жизнеспособность составного масштабирования при обнаружении объектов. Однако стремительный темп исследований в области ИИ привел к появлению моделей, которые просто более функциональны, легче интегрируются и работают быстрее.

Благодаря мощным возможностям для решения нескольких задач, невероятной скорости инференса на GPU и, возможно, самому дружелюбному API для разработчиков в индустрии, YOLO11 является очевидным победителем для современных конвейеров компьютерного зрения. Для тех, кто нацелен на передовой край технологий — особенно при работе с edge-устройствами — переход на YOLO26 обеспечит лучшее сочетание скорости без NMS и непревзойденной точности.

Комментарии