Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 против EfficientDet#

Выбор оптимальной архитектуры нейронной сети — это фундамент любого успешного проекта по computer vision. Это руководство предоставляет подробное техническое сравнение двух ключевых моделей в истории object detection architectures: YOLOv7 и EfficientDet. Изучив их архитектурные инновации, методологии обучения и идеальные сценарии развертывания, ты сможешь принимать обоснованные решения. Мы также исследуем, как современные достижения, в частности инновационная Ultralytics YOLO26, переопределили текущий уровень развития технологий.

Link to this sectionПроисхождение моделей и технические подробности#

Обе модели были разработаны известными исследовательскими командами и привнесли значительные достижения в область machine learning.

YOLOv7 Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao Организация: Institute of Information Science, Academia Sinica, Taiwan Дата: 2022-07-06 Arxiv: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors GitHub: WongKinYiu/yolov7 Документация: Ultralytics YOLOv7 Documentation

Узнай больше о YOLOv7

EfficientDet Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le Организация: Google Research Дата: 2019-11-20 Arxiv: EfficientDet: Scalable and Efficient Object Detection GitHub: Google AutoML EfficientDet

Узнай больше об EfficientDet

Link to this sectionАрхитектурные различия и сбалансированный анализ#

Понимание фундаментальных структурных различий между этими сетями имеет решающее значение для эффективного model deployment.

Link to this sectionEfficientDet: compound scaling и BiFPN#

Разработанная в экосистеме TensorFlow, EfficientDet представила принципиальный подход к масштабированию моделей. Вместо произвольного расширения или углубления сети, исследователи Google использовали метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину.

Кроме того, EfficientDet представила Bi-directional Feature Pyramid Network (BiFPN). Этот архитектурный компонент обеспечивает простое и быстрое многомасштабное объединение признаков.

Преимущества: Высокая параметрическая эффективность, достижение высокого показателя mean Average Precision (mAP) при меньшем количестве FLOPs по сравнению со многими аналогами. Недостатки: Сильная зависимость от устаревших стратегий поиска AutoML. Интеграция в современные динамические рабочие процессы PyTorch может быть затруднительной, а задержка на граничных устройствах зачастую выше ожидаемой, несмотря на низкое количество FLOPs.

Link to this sectionYOLOv7: Обучаемый "набор бесплатных улучшений" (Trainable Bag-of-Freebies)#

В YOLOv7 приоритет был отдан real-time inference и оптимизации обучения. Модель представила концепцию расширенной сети агрегации эффективных слоев (E-ELAN), которая позволяет модели непрерывно изучать более разнообразные признаки, не разрушая исходный путь градиента. YOLOv7 также применила технику под названием "trainable bag-of-freebies", которая значительно повышает точность обнаружения без увеличения стоимости вывода.

Преимущества: Исключительная скорость обработки и благоприятная inference latency, что делает модель идеальной для видеопотоков с высоким FPS. Недостатки: Несмотря на высокую эффективность, она по-прежнему полагается на anchor boxes и требует использования Non-Maximum Suppression (NMS) при постобработке, что может создать узкое место в задержке в сценах с высокой плотностью объектов.

Преимущества экосистемы Ultralytics

При оценке моделей окружающая экосистема так же важна, как и архитектура. Интегрированная Ultralytics Platform предоставляет единый API, обширную документацию и активную поддержку сообщества. Эта унифицированная среда гарантирует меньшее использование памяти во время обучения по сравнению с тяжелыми моделями Transformer, обеспечивая быстрое прототипирование и бесшовное experiment tracking.

Link to this sectionПоказатели производительности и бенчмарки#

В таблице ниже приведены ключевые performance metrics, позволяющие разработчикам оценить компромиссы между скоростью, количеством параметров и точностью.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Как показано, хотя EfficientDet-d7 достигает высокого mAP, ее скорость в TensorRT значительно отстает от вариантов YOLOv7, что подчеркивает доминирование последних в real-time object detection с ускорением на GPU.

Link to this sectionЭволюция обнаружения объектов: YOLO26#

Хотя YOLOv7 и EfficientDet заложили важную основу, ландшафт vision AI быстро развивается. Для современных приложений, требующих максимальной эффективности и точности, мы настоятельно рекомендуем обновиться до YOLO26, выпущенной в январе 2026 года.

YOLO26 устраняет присущие предыдущим поколениям ограничения, предлагая беспрецедентную versatility в object detection, instance segmentation, image classification и pose estimation.

Узнай больше о YOLO26

Link to this sectionКлючевые инновации YOLO26#

  • Дизайн End-to-End без NMS: YOLO26 нативно исключает постобработку Non-Maximum Suppression (NMS). Впервые примененная в YOLOv10, эта функция упрощает логику развертывания и гарантирует стабильное выполнение с низкой задержкой независимо от плотности объектов.
  • DFL Removal: By removing the Distribution Focal Loss (DFL), the model architecture is vastly simplified, enhancing compatibility with highly constrained edge computing environments.
  • До 43% быстрее при выводе на CPU: Значительно оптимизирована для сред без выделенных GPU, что делает ее экспоненциально быстрее, чем EfficientDet на легком оборудовании.
  • Оптимизатор MuSGD: Вдохновленный методами больших языковых моделей (такими как Kimi K2 от Moonshot AI), этот гибрид SGD и Muon привносит стабильность уровня LLM и быструю сходимость в computer vision training.
  • ProgLoss + STAL: Эти передовые функции потерь обеспечивают значительные улучшения в распознавании мелких объектов — критически важная функция для aerial imagery и drone applications.
  • Улучшения для конкретных задач: Включает потерю семантической сегментации и многомасштабный proto для задач сегментации, Residual Log-Likelihood Estimation (RLE) для сложной оценки Pose, а также специализированную потерю угла, предназначенную для исправления проблем с границами Oriented Bounding Box (OBB).

Для команд, использующих устаревшие системы, переход на Ultralytics Platform открывает доступ к оптимизированному рабочему процессу, где эти передовые модели можно легко обучать и развертывать. Ты также можешь рассмотреть предыдущие надежные итерации, такие как YOLO11 и YOLOv8, в зависимости от специфических требований к обратной совместимости.

Link to this sectionУпрощенное обучение и простота использования#

Одной из определяющих характеристик моделей Ultralytics является исключительная простота использования. В отличие от сложной настройки с множеством зависимостей, требуемой для сред TensorFlow AutoML в EfficientDet, Ultralytics предоставляет простой, Pythonic API.

This environment minimizes CUDA memory usage during training, ensuring that even large datasets can be processed efficiently without Out-Of-Memory (OOM) errors commonly seen in bulky Transformer-based architectures.

Link to this sectionПример кода: начало работы с Ultralytics#

Следующий фрагмент демонстрирует, как ты можешь использовать Ultralytics package для обучения современной модели YOLO26 прямо из коробки.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model for object detection
model = YOLO("yolo26n.pt")

# Train the model effortlessly using the integrated Ultralytics ecosystem
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Auto-selects optimal device
    batch=16,
)

# Validate the model's performance
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Export the model for edge deployment (e.g., OpenVINO for CPU optimization)
model.export(format="openvino")
Экспорт для продакшена

Модели, обученные через Ultralytics API, можно мгновенно экспортировать в различные форматы для продакшена, такие как OpenVINO или ONNX, обеспечивая высокую пропускную способность независимо от целевого оборудования.

Link to this sectionИдеальные сценарии использования и реальные приложения#

При проектировании решения крайне важно соотносить сильные стороны модели с конкретным вариантом использования.

Link to this sectionКогда использовать EfficientDet#

EfficientDet остается кандидатом для устаревших академических исследований или сред, строго привязанных к экосистеме Google Cloud, где основное внимание уделяется экспериментам с составным масштабированием. Ее более компактные варианты (d0-d2) полезны, если объем дискового пространства сильно ограничен.

Link to this sectionКогда использовать YOLOv7#

YOLOv7 превосходно работает в высокопроизводительных устаревших системах, особенно там, где интеграция с PyTorch предпочтительнее TensorFlow. Она до сих пор широко используется в:

  • Видеоаналитике: Обработка потоков безопасности с высокой частотой кадров, где широко доступно ускорение GPU.
  • Промышленном контроле: Выявление дефектов на быстро движущихся manufacturing assembly lines.

Link to this sectionКогда стоит выбрать YOLO26#

Для всех новых развертываний мы однозначно рекомендуем YOLO26. Ее непревзойденный баланс производительности и надежная well-maintained ecosystem делают ее оптимальным выбором для:

  • Умных городов и управления трафиком: Дизайн без NMS обеспечивает стабильную задержку вывода, что жизненно важно для traffic coordination в реальном времени.
  • Робототехники и автономных систем: Впечатляющий прирост скорости вывода на CPU на 43% обеспечивает высокую отзывчивость алгоритмов навигации для встроенных устройств.
  • Сельского хозяйства и воздушного мониторинга: Использование ProgLoss и STAL для точной идентификации мелких объектов, таких как определенные культуры или дикие животные, на снимках с большой высоты.

Вкратце, хотя EfficientDet и YOLOv7 предлагают ценный исторический контекст и пользу в определенных нишах, современному инженеру по компьютерному зрению лучше всего использовать архитектуру Ultralytics YOLO26, которая элегантно устраняет предыдущие узкие места, расширяя границы возможного в искусственном интеллекте.

Контрибьюторы

Комментарии