Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 против PP-YOLOE+#

При оценке современных моделей компьютерного зрения для производственных конвейеров разработчики часто взвешивают преимущества различных архитектур. Две примечательные модели в области обнаружения объектов — это YOLOv7 и PP-YOLOE+. В этом руководстве представлено подробное техническое сравнение их архитектур, метрик производительности и идеальных сценариев развертывания, чтобы помочь тебе принять обоснованное решение для твоего следующего проекта в области компьютерного зрения.

Link to this sectionАрхитектурные инновации#

Понимание основных структурных различий между этими моделями имеет решающее значение для прогнозирования того, как они будут вести себя во время обучения и вывода.

Link to this sectionОсновные особенности архитектуры YOLOv7#

YOLOv7 представила несколько ключевых улучшений, разработанных для повышения точности без существенного увеличения затрат на вывод.

  • Extended Efficient Layer Aggregation Networks (E-ELAN): Эта архитектура управляет кратчайшими и длиннейшими путями градиента. Благодаря этому сеть может изучать более разнообразные признаки и улучшает общую способность к обучению, не разрушая исходный путь градиента.
  • Стратегии масштабирования моделей: YOLOv7 использует составное масштабирование моделей, одновременно регулируя глубину и ширину при объединении слоев для поддержания оптимальной структуры архитектуры при разных размерах.
  • Обучаемый Bag-of-Freebies: Авторы интегрировали метод репараметризованной свертки (RepConv) без identity-связей, что значительно увеличивает скорость вывода без ущерба для предсказательной мощности модели.

Детали YOLOv7:
Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
Организация: Institute of Information Science, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696

Узнай больше о YOLOv7

Link to this sectionОсновные особенности архитектуры PP-YOLOE+#

Разработанная Baidu в рамках экосистемы PaddlePaddle, PP-YOLOE+ основывается на своем предшественнике, PP-YOLOv2, уделяя большое внимание методологиям без якорей (anchor-free) и улучшенным представлениям признаков.

  • Дизайн без якорей (Anchor-Free): В отличие от подходов на основе якорей, этот дизайн упрощает голову предсказания и сокращает количество гиперпараметров, что облегчает настройку модели для пользовательских наборов данных.
  • Backbone CSPRepResNet: Этот backbone включает в себя остаточные связи и сети Cross Stage Partial для улучшения возможностей извлечения признаков при сохранении вычислительной эффективности.
  • Task Alignment Learning (TAL): PP-YOLOE+ использует ET-head (Efficient Task-aligned head) для лучшего выравнивания задач классификации и локализации, устраняя распространенное узкое место в одностадийных детекторах.

Детали PP-YOLOE+:
Авторы: PaddlePaddle Authors
Организация: Baidu
Дата: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250

Узнай больше о PP-YOLOE+

Link to this sectionПоказатели производительности и бенчмарки#

Выбор подходящей модели часто сводится к конкретным ограничениям твоего оборудования и требованиям к задержке. В таблице ниже показаны компромиссы между точностью (mAP), скоростью и сложностью модели.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this sectionАнализ результатов#

  • Сценарии высокой точности: YOLOv7x демонстрирует отличную производительность, достигая высокого mAP, что конкурентоспособно для сложных задач обнаружения. Хотя PP-YOLOE+x показывает чуть более высокий mAP, это происходит за счет значительного увеличения количества параметров и FLOPs.
  • Эффективность и скорость: Меньшие варианты PP-YOLOE+ (t и s) предлагают чрезвычайно низкие показатели скорости TensorRT, что делает их очень подходящими для развертывания на периферийных устройствах, где действуют строгие аппаратные ограничения.
  • Оптимальный выбор: YOLOv7l обеспечивает убедительный баланс, выдавая более 51% mAP при сохранении времени вывода менее 7 мс на GPU T4, что делает его надежным выбором для стандартных серверных приложений реального времени.
Оптимизация для продакшена

При развертывании этих моделей использование форматов экспорта, таких как TensorRT или ONNX, может значительно снизить задержку по сравнению с нативным выводом в PyTorch.

Link to this sectionПреимущество Ultralytics#

Хотя и YOLOv7, и PP-YOLOE+ предлагают высокую производительность, опыт разработки и поддержка экосистемы не менее важны для успеха проекта.

Link to this sectionУпрощенный пользовательский опыт#

Модели Ultralytics отдают приоритет простоте использования через унифицированный Python API. В отличие от PP-YOLOE+, которая требует навигации по экосистеме PaddlePaddle и ее специфическим файлам конфигурации, Ultralytics позволяет тебе плавно перейти от обучения к развертыванию.

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov7.pt")

# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for optimized deployment
model.export(format="engine")  # TensorRT export

Link to this sectionЭффективность ресурсов#

Основная сильная сторона моделей Ultralytics YOLO — их более низкие требования к памяти как во время обучения, так и во время вывода. Эта эффективность позволяет исследователям и разработчикам использовать большие размеры батчей на потребительском оборудовании, ускоряя процесс обучения по сравнению с более тяжелыми моделями или сложными архитектурами Transformer, такими как RT-DETR.

Link to this sectionЭкосистема и универсальность#

Экосистема Ultralytics исключительно хорошо поддерживается, отличаясь частыми обновлениями, обширной документацией и нативной поддержкой разнообразных задач помимо стандартного обнаружения. С Ultralytics единый фреймворк поддерживает сегментацию экземпляров, оценку позы, классификацию и ориентированные ограничивающие рамки (OBB), обеспечивая непревзойденную универсальность, которой часто не хватает конкурирующим моделям.

Link to this sectionБудущее ИИ в компьютерном зрении: YOLO26#

По мере того как компьютерное зрение быстро развивается, появились новые архитектуры, которые переопределяют стандарты скорости и эффективности. Выпущенная в январе 2026 года Ultralytics YOLO26 представляет собой вершину этой эволюции и является настоятельно рекомендуемым выбором для всех новых проектов.

Ключевые инновации YOLO26:

  • Дизайн без NMS (End-to-End): YOLO26 исключает постобработку Non-Maximum Suppression (NMS). Этот нативно сквозной подход кардинально упрощает логику развертывания и снижает переменную задержку — прорыв, впервые представленный в YOLOv10.
  • Беспрецедентная производительность на периферии: Благодаря удалению Distribution Focal Loss (DFL), YOLO26 достигает до 43% более быстрого вывода на CPU, что делает его превосходным решением для IoT и периферийных устройств по сравнению с предыдущими поколениями.
  • Продвинутая динамика обучения: Интеграция оптимизатора MuSGD Optimizer — вдохновленного инновациями в LLM, такими как Kimi K2 от Moonshot AI — обеспечивает более стабильное обучение и более быструю сходимость.
  • Превосходное обнаружение мелких объектов: Улучшенные функции потерь, в частности ProgLoss + STAL, решают исторические слабости в распознавании мелких объектов, что крайне важно для таких приложений, как аэросъемка.

Link to this sectionПрименение в реальных условиях#

Выбор между этими архитектурами часто зависит от конкретной среды развертывания.

Link to this sectionКогда выбирать PP-YOLOE+#

  • Интеграция с PaddlePaddle: Если твоя инфраструктура уже глубоко интегрирована с экосистемой PaddlePaddle от Baidu, PP-YOLOE+ отлично впишется в нее.
  • Промышленная инспекция в Азии: Часто используется в азиатских производственных центрах, где аппаратные и программные стеки заранее настроены под инструменты Baidu.

Link to this sectionКогда выбирать YOLOv7#

  • Системы с ускорением на GPU: Исключительно хорошо работает на серверных GPU для задач, требующих высокой пропускной способности, таких как видеоаналитика.
  • Интеграция в робототехнику: Идеально подходит для интеграции компьютерного зрения в робототехнику, обеспечивая быстрое принятие решений в динамических средах.
  • Академические исследования: Широко поддерживается и часто используется в качестве надежного базового уровня (baseline) в исследованиях на базе PyTorch.

Хотя старые модели имеют историческое значение, переход на современные архитектуры, такие как YOLO26 или YOLO11, через Ultralytics Platform гарантирует доступ к новейшим оптимизациям, простейшим рабочим процессам обучения и самой широкой многозадачной поддержке, доступной сегодня.

Контрибьюторы

Комментарии