Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet против YOLOv5#

Выбор оптимальной архитектуры нейронной сети — определяющий шаг в любой инициативе в области компьютерного зрения. Баланс между задержкой вывода, эффективностью параметров и точностью обнаружения определяет, насколько хорошо модель будет работать в реальных условиях. Это полное техническое руководство содержит глубокий анализ двух чрезвычайно влиятельных фреймворков для обнаружения объектов: EfficientDet от Google и YOLOv5 от Ultralytics.

Сравнивая их архитектурные инновации, методологии обучения и возможности развертывания, разработчики могут принимать обоснованные решения для своих конкретных сред развертывания, будь то масштабирование на облачных серверах или работа на ограниченных по ресурсам граничных устройствах.

Link to this sectionEfficientDet: Масштабируемая архитектура с BiFPN#

Представленная Google Research, модель EfficientDet была разработана для систематического масштабирования как основы (backbone), так и сети признаков, чтобы достичь высокой точности с меньшим количеством параметров по сравнению с предыдущими передовыми моделями.

Link to this sectionПодробности о модели#

Link to this sectionАрхитектурные инновации#

EfficientDet использует модель классификации EfficientNet в качестве основы, применяя метод составного масштабирования, который равномерно масштабирует ширину, глубину и разрешение сети. Ее наиболее заметный вклад в обнаружение объектов — это внедрение двунаправленной пирамидальной сети признаков (BiFPN). В отличие от стандартных пирамидальных сетей, которые просто агрегируют признаки сверху вниз, BiFPN допускает сложные, двунаправленные кросс-масштабные связи и вводит обучаемые веса для определения важности различных входных признаков.

Несмотря на высокую точность, EfficientDet сильно полагается на экосистему TensorFlow и специфические библиотеки AutoML. Эта зависимость иногда затрудняет интеграцию в пользовательские, легковесные конвейеры развертывания или среды, предпочитающие динамические вычислительные графы.

Узнай больше об EfficientDet

Link to this sectionUltralytics YOLOv5: Демократизация ИИ в реальном времени#

Выпущенная вскоре после EfficientDet, Ultralytics YOLOv5 произвела революцию в индустрии, предложив невероятно доступную, нативную реализацию архитектуры YOLO на PyTorch. Она установила новый стандарт удобства для разработчиков, эффективности обучения и гибкости развертывания в реальном времени.

Link to this sectionПодробности о модели#

Link to this sectionАрхитектурные инновации#

YOLOv5 представила значительные улучшения по сравнению со своими предшественниками, используя основу CSPDarknet (Cross-Stage Partial), которая значительно улучшает градиентный поток, уменьшая при этом общее количество параметров. Кроме того, YOLOv5 включает функцию Auto-Learning Anchor Boxes, которая автоматически вычисляет оптимальные априорные данные ограничивающих рамок (bounding box) на основе твоих конкретных данных для обучения, устраняя необходимость в ручной настройке гиперпараметров.

YOLOv5 также активно использует аугментацию Mosaic, объединяя четыре разных изображения в одну обучающую плитку. Это значительно улучшает способность модели обнаруживать мелкие объекты и обобщать контекстуальное понимание, делая ее очень устойчивой в различных средах.

Узнай больше о YOLOv5

Link to this sectionПроизводительность и бенчмарки#

Оценка моделей на стандартных бенчмарках, таких как набор данных COCO, имеет решающее значение для понимания компромиссов между точностью и скоростью. В таблице ниже показано, как модели EfficientDet и YOLOv5 разных размеров работают в стандартизированных условиях.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionАнализ компромиссов#

Хотя EfficientDet-d7 масштабируется до впечатляющего пикового mAP 53,7, она страдает от значительной задержки вывода на оборудовании GPU по сравнению с архитектурами YOLO. Напротив, YOLOv5 превосходит всех в аппаратном ускорении. Вариант YOLOv5n достигает поразительно быстрого времени вывода 1,12 мс на GPU T4 с использованием NVIDIA TensorRT, что делает ее значительно превосходящей для приложений реального времени, таких как автономное вождение или высокоскоростные производственные линии.

Кроме того, модели YOLOv5 демонстрируют гораздо более низкие требования к памяти CUDA во время обучения по сравнению со сложными сетями с составным масштабированием или большими моделями Transformer. Этот экономный профиль памяти демократизирует доступ к современному ИИ, позволяя исследователям обучать надежные модели на стандартном потребительском оборудовании.

Максимизация эффективности оборудования

Чтобы получить максимальное количество кадров в секунду (FPS) от твоей модели YOLOv5 на граничных устройствах, экспортируй свои веса PyTorch в TensorRT для GPU NVIDIA или в OpenVINO для CPU Intel. Этот шаг часто может удвоить скорость твоего вывода.

Link to this sectionЭкосистема обучения и опыт разработчика#

Истинное преимущество экосистемы Ultralytics заключается в ее оптимизированном пользовательском опыте. В то время как EfficientDet требует глубоких знаний API обнаружения объектов TensorFlow, YOLOv5 предоставляет последовательный, простой Python API.

Хорошо поддерживаемая экосистема Ultralytics гарантирует, что у разработчиков есть доступ к частым обновлениям, активной поддержке сообщества и бесшовным интеграциям с инструментами отслеживания экспериментов, такими как Weights & Biases и ClearML.

Link to this sectionПример кода: Начало работы с YOLOv5#

Запуск вывода с предварительно обученной моделью YOLOv5 требует всего несколько строк кода через PyTorch Hub:

from ultralytics import YOLO

# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display the detected bounding boxes
results[0].show()

Link to this sectionУниверсальность и реальные приложения#

EfficientDet — это строго фреймворк для обнаружения объектов, что ограничивает его полезность в сложных конвейерах зрения. С другой стороны, YOLOv5 развилась для поддержки нескольких задач компьютерного зрения. Современные выпуски модели поддерживают высокоточную сегментацию экземпляров и классификацию изображений, позволяя разработчикам консолидировать свой стек машинного обучения.

Link to this sectionИдеальные варианты использования#

  • EfficientDet: Лучше всего подходит для автономной обработки, академических исследований и облачной аналитики, где максимальная точность важнее задержки, и где доступны серверные TPU или GPU с большим объемом памяти.
  • YOLOv5: Окончательный выбор для развертывания граничного ИИ. Сочетание низкой задержки, крошечного объема параметров и высокой точности делает ее идеальной для аналитики дронов, автоматизации розничной торговли в реальном времени и мобильных приложений через CoreML или TFLite.

Link to this sectionСледующее поколение: Обновление до YOLO26#

Хотя YOLOv5 остается надежной и широко используемой моделью, область ИИ быстро развивается. Для команд, начинающих новые проекты или стремящихся к абсолютному пику современной производительности, Ultralytics представила YOLO26, выпущенную в январе 2026 года.

YOLO26 переопределяет границу Парето скорости и точности, вводя революционные архитектурные сдвиги, которые облегчают развертывание и ускоряют вывод.

Link to this sectionКлючевые достижения YOLO26#

  • Конструкция End-to-End без NMS: YOLO26 нативно исключает постобработку Non-Maximum Suppression. Это значительно упрощает логику развертывания и уменьшает дисперсию задержки — революционный подход, усовершенствованный на основе ранних экспериментов в YOLOv10.
  • До 43% более быстрый вывод на CPU: Специально разработана для граничных вычислений и IoT-устройств с низким энергопотреблением, работающих без выделенных GPU.
  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (таких как Kimi K2 от Moonshot AI), этот гибрид SGD и Muon привносит инновации LLM в компьютерное зрение, обеспечивая более быструю сходимость и высокостабильную динамику обучения.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что критически важно для аэрофотосъемки и робототехники.
  • Удаление DFL: Благодаря удалению Distribution Focal Loss заголовок модели значительно упрощен, что приводит к лучшей совместимости при экспорте на устаревшее или сильно ограниченное граничное оборудование.

Для команд, развертывающих многозадачные конвейеры, YOLO26 также представляет обновления для конкретных задач, такие как multi-scale proto для сегментации и специализированная функция angle loss для ориентированных ограничивающих рамок (OBB). Чтобы изучить другие современные альтернативы в рамках экосистемы, ты также можешь рассмотреть YOLO11 или архитектуру YOLOv8.

Link to this sectionЗаключение#

Выбор между EfficientDet и YOLOv5 сильно зависит от твоей цели развертывания. EfficientDet предлагает математически элегантный подход к масштабированию, подходящий для облачного вывода. Однако превосходный опыт разработчика YOLOv5, чрезвычайно быстрые циклы обучения PyTorch и высокооптимизированные возможности граничного развертывания делают ее предпочтительным выбором для подавляющего большинства реальных приложений реального времени. Используя комплексные инструменты, предоставляемые Ultralytics, команды могут ускорить выход на рынок и создавать высокочувствительные системы ИИ.

Участники

Комментарии