YOLOv6.0 против EfficientDet: баланс между промышленной скоростью и масштабируемой точностью
В постоянно развивающейся области компьютерного зрения выбор правильной архитектуры обнаружения объектов имеет решающее значение для успешного внедрения. В этом сравнении рассматриваются две влиятельные модели: YOLOv6.YOLOv6, ориентированная на скорость промышленная платформа от Meituan, и EfficientDet, высокомасштабируемая архитектура, разработанная Google . В то время как EfficientDet представила революционные концепции эффективности, YOLOv6. YOLOv6 оптимизирует эти принципы для современного GPU .
Сравнение метрик производительности
В следующей таблице показаны компромиссы между двумя архитектурами с точки зрения производительности. YOLOv6. YOLOv6 демонстрирует превосходную задержку на GPU благодаря своей аппаратно-ориентированной конструкции, в то время как EfficientDet предлагает гранулярную масштабируемость в широком диапазоне ограничений.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv6-3.0: Промышленный скоростной
Выпущенный 13 января 2023 года авторами Чуй Ли, Лулу Ли и командой Meituan, YOLOv6.YOLOv6 (часто называемыйYOLOv6 .0») представляет собой «полномасштабную перезагрузку» фреймворка. Он был специально разработан для промышленных приложений, где высокая пропускная способность и низкая задержка на графических процессорах являются обязательными условиями.
Архитектурные инновации
YOLOv6.0 интегрирует двунаправленную сеть агрегации путей (Bi-PAN), которая улучшает возможности слияния функций по сравнению со стандартными структурами PANet. Важно, что она использует блоки типа RepVGG, что позволяет модели иметь многоветвленную топологию во время обучения для лучшего градиентного потока, который затем сводится к однопутевой структуре во время вывода. Эта техника перепараметризации значительно повышает скорость вывода на таком оборудовании, как NVIDIA T4 и GeForce GPU.
Дополнительные функции включают:
- Обучение с помощью якорей (AAT): гибридная стратегия, сочетающая в себе парадигмы детекторов на основе якорей и без якорей для стабилизации конвергенции.
- Разделенная головка: разделяет ветви классификации и регрессии, повышая точность за счет возможности обучения каждой задаче независимым характеристикам.
EfficientDet: масштабируемый стандарт
Разработанная командой Google (Минсин Тан, Руоминг Панг, Куок В. Ле) и выпущенная 20 ноября 2019 года, EfficientDet представила концепцию составного масштабирования для обнаружения объектов. Она построена на основе EfficientNet и представляет двунаправленную пирамиду признаков (BiFPN).
Архитектурные преимущества
Основной инновацией EfficientDet является BiFPN, которая позволяет легко и быстро объединять многомасштабные характеристики. В отличие от традиционных FPN, BiFPN использует обучаемые веса для понимания важности различных входных характеристик. Модель масштабируется в основном с помощью составного коэффициента $\phi$, который равномерно масштабирует разрешение, глубину и ширину. Это позволяет EfficientDet ориентироваться на очень специфические ограничения ресурсов, от мобильных устройств (d0) до высокоточных серверных задач (d7).
Заметка о наследии
Хотя EfficientDet достигает высокой эффективности параметров (небольшой размер модели), его сложные слои BiFPN и функции активации Swish могут быть вычислительно затратными на некоторых пограничных ускорителях по сравнению со стандартными свертками 3x3, используемыми в YOLO .
Техническое сравнение и анализ
1. Задержка против эффективности
Наиболее заметная разница заключается в том, как определяется «эффективность». EfficientDet оптимизирует FLOP (операции с плавающей запятой) и количество параметров, достигая превосходной точности с очень маленькими файлами моделей (например, EfficientDet-d0 имеет только 3,9 млн параметров). Однако низкие FLOP не всегда означают низкую задержку.
YOLOv6.YOLOv6 оптимизирован для задержки вывода на графических процессорах. Как видно из таблицы, YOLOv6. YOLOv6 работает со скоростью 1,17 мс на GPU T4, тогда как сопоставимый EfficientDet-d0 требует 3,92 мс— почти в 3 раза медленнее, несмотря на меньшее количество параметров. Это делает YOLOv6 для анализа видео в реальном времени.
2. Экосистема обучения
EfficientDet в значительной степени опирается на TensorFlow и библиотеки AutoML. Несмотря на свою мощность, их интеграция в современные рабочие процессы PyTorch может быть затруднительна. YOLOv6, а именно его интеграция в Ultralytics , выигрывает от более доступной PyTorch , что упрощает отладку, модификацию и развертывание.
3. Универсальность
EfficientDet в первую очередь предназначен для обнаружения ограничивающих рамок. В отличие от него, современные YOLO , поддерживаемые Ultralytics в многозадачные обучающие системы.
Преимущество Ultralytics
Хотя YOLOv6. YOLOv6 и EfficientDet являются эффективными моделями, Ultralytics предлагает унифицированный интерфейс, который значительно упрощает жизненный цикл машинного обучения. Независимо от того, используете ли вы YOLOv8, YOLO11 или передовую YOLO26, разработчики получают следующие преимущества:
- Простота использования: единый Python , который позволяет переключаться между моделями, изменяя одну строку.
- Баланс производительности: Ultralytics разработаны таким образом, чтобы обеспечить оптимальный компромисс между скоростью и средней точностью (mAP).
- Хорошо поддерживаемая экосистема: активная поддержка, частые обновления и беспроблемная интеграция с такими инструментами, как Ultralytics для управления наборами данных и обучения в облаке.
- Требования к памяти: значительно более низкое использование VRAM во время обучения по сравнению с архитектурами с интенсивным использованием трансформаторов, что делает доступ к высокопроизводительному обучению ИИ более демократичным.
Обновитесь до YOLO26
Для разработчиков, стремящихся к абсолютному пику производительности, YOLO26 (выпущен в январе 2026 года) еще больше расширяет границы возможного. В нем представлена сквозная конструкция NMS, устраняющая необходимость в постобработке с помощью немаксимального подавления. Это снижает разброс задержек и упрощает логику развертывания.
Ключевые инновации YOLO26 включают:
- MuSGD Optimizer: гибридный оптимизатор, вдохновленный обучением LLM (Kimi K2 от Moonshot AI), для стабильной конвергенции.
- Удаление DFL: удаление распределительной фокальной потери упрощает выходную головку, повышая совместимость с периферийными устройствами.
- ProgLoss + STAL: усовершенствованные функции потери, которые улучшают обнаружение мелких объектов, что крайне важно для применения в дронах и IoT.
- Ускорение CPU до 43%: оптимизировано специально для сред без выделенных графических процессоров.
Python : обучение с Ultralytics
Следующий код демонстрирует, насколько просто обучить современную модель с помощью Ultralytics . Этот унифицированный API без проблем поддерживает YOLOv8, YOLO11 и YOLO26.
from ultralytics import YOLO
# Load the cutting-edge YOLO26n model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset for 100 epochs
# The system automatically handles dataset downloading and configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
Рекомендации по вариантам использования
Когда следует выбирать YOLOv6-3.0
- Производственные линии: высокоскоростное обнаружение дефектов, где доступно GPU и задержка должна быть менее 5 мс.
- Аналитика «умного города»: обработка огромного количества видеопотоков на серверных графических процессорах (например, T4, A100).
- Автоматизация розничной торговли: распознавание товаров в режиме реального времени в автоматизированных кассовых системах.
Когда следует выбирать EfficientDet
- Storage-Constrained Devices: Legacy IoT devices where the model weight file size (e.g., <5MB) is the primary constraint.
- Академические исследования: Исследования, посвященные сетям пирамидных характеристик или законам сложного масштабирования.
- TensorFlow : существующие конвейеры, глубоко укоренившиеся вTPU Google.
Когда выбрать Ultralytics
- Edge Computing: развертывание на устройствах, CPU, таких как Raspberry Pi или мобильные телефоны, с использованием на 43 % более быстрого CPU .
- Робототехника: приложения, требующие оценки положения или ориентированного обнаружения объектов (OBB) наряду со стандартным обнаружением.
- Новые разработки: проекты, требующие долгосрочного обслуживания, простой экспорт в TensorRT или ONNX, а также активной поддержки сообщества.
Заключение
Как YOLOv6. YOLOv6, так и EfficientDet оказали большое влияние на область обнаружения объектов. EfficientDet доказал ценность составного масштабирования, а YOLOv6. YOLOv6 продемонстрировал, как адаптировать архитектуру для максимальной GPU . Однако для большинства современных приложений Ultralytics предлагает наиболее привлекательный пакет: сквозную эффективность, превосходную скорость и универсальную, перспективную экосистему.
Пользователи, заинтересованные в изучении других высокопроизводительных вариантов, могут также рассмотреть YOLOv8, YOLOv9или YOLO11 в зависимости от их конкретных потребностей в поддержке устаревших версий.