Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 против YOLOv7#

Ландшафт computer vision продолжает стремительно развиваться, а обнаружение объектов в реальном времени остается передовым направлением в AI-приложениях. Выбор правильной архитектуры для твоего проекта требует поиска баланса между скоростью, точностью и простотой развертывания. В этом руководстве мы предлагаем всестороннее техническое сравнение двух выдающихся архитектур: Ultralytics YOLO11 и YOLOv7.

Link to this sectionИстория моделей и технические детали#

Обе модели оказали значительное влияние на сообщество глубокого обучения, но они основаны на разных философиях разработки и появились в разные эпохи.

Детали YOLO11:
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/

Узнай больше о YOLO11

Детали YOLOv7:
Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
Организация: Institute of Information Science, Academia Sinica, Taiwan
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/

Узнай больше о YOLOv7

Link to this sectionАрхитектурные различия#

При анализе внутренних механизмов видно, что оба детектора используют передовые концепции, однако их структурные основы различаются.

YOLOv7 представила концепцию Extended Efficient Layer Aggregation Networks (E-ELAN). Эта архитектура была разработана для постоянного улучшения способности сети к обучению без разрушения исходного пути градиента — это важный прорыв, описанный в их research paper. YOLOv7 сильно опирается на структурную репараметризацию и надежную методологию «bag-of-freebies» во время обучения, что повышает общую точность на COCO dataset без увеличения затрат на инференс.

Напротив, YOLO11 построена на базе высокооптимизированной Ultralytics architecture. Она делает упор на более усовершенствованный конвейер feature extraction с меньшим количеством параметров, что ведет к снижению потребления памяти при обучении. YOLO11 достигает очень выгодного баланса производительности, используя меньше вычислительных ресурсов (FLOPs) при этом соответствуя или превосходя точность обнаружения более тяжелых моделей. Кроме того, YOLO11 изначально поддерживает более широкий спектр задач, что делает ее крайне универсальным выбором для современных приложений computer vision.

Эффективность памяти

Одной из отличительных особенностей моделей Ultralytics YOLO являются более низкие требования к памяти во время обучения по сравнению с другими передовыми моделями, что позволяет разработчикам обучать мощные сети на потребительском «железе» PyTorch.

Link to this sectionСравнение производительности и метрик#

Чтобы точно оценить жизнеспособность в реальных условиях, необходимо оценивать такие метрики, как mean Average Precision (mAP), скорость инференса, количество параметров модели и вычислительную сложность (FLOPs). В следующей таблице показано сравнение масштабируемых вариантов YOLO11 с более крупными моделями YOLOv7.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Как видишь, такая модель, как YOLO11x, достигает более высокого результата 54.7 mAP по сравнению с 53.1 mAP у YOLOv7x, при этом используя значительно меньше параметров (56.9M против 71.3M). Это подчеркивает превосходную архитектурную эффективность YOLO11.

Link to this sectionЭффективность обучения и удобство экосистемы#

Одной из самых определяющих характеристик, разделяющих эти две архитектуры, является опыт разработчика и окружающая экосистема.

YOLOv7 — это по сути репозиторий для академических исследований. Обучение моделей часто требует сложной настройки окружения, управления зависимостями вручную и использования длинных аргументов командной строки. Хотя она поддерживает передовые эксперименты, адаптация кода YOLOv7 GitHub repository для пользовательских производственных сред может занять много времени.

YOLO11 полностью переосмысливает простоту использования. Она полностью интегрирована в Ultralytics Platform — комплексную и хорошо поддерживаемую экосистему, предлагающую плавные сквозные рабочие процессы. От разметки данных и локального обучения до развертывания — единый Python API и простой интерфейс командной строки упрощают весь процесс.

Link to this sectionСравнение кода#

Обучение модели обнаружения объектов с помощью YOLO11 требует всего несколько строк кода, что значительно снижает порог входа:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Quickly export to ONNX format
model.export(format="onnx")

Для сравнения, типичная команда обучения YOLOv7 выглядит так, требуя тщательной настройки путей, файлов конфигурации и bash-скриптов:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

YOLO11 также обеспечивает огромную универсальность. В то время как YOLOv7 требует использования совершенно разных кодовых баз или серьезных модификаций для поддержки задач помимо обнаружения (например, pose или segmentation), YOLO11 обрабатывает object detection, instance segmentation, image classification, pose estimation и обнаружение Oriented Bounding Box (OBB) с помощью единого целостного фреймворка.

Упрощенный экспорт

Экспорт YOLO11 в такие форматы, как TensorRT или OpenVINO, требует всего одной команды, что позволяет избежать проблем с поддержкой операторов, часто возникающих в старых моделях.

Link to this sectionРеальные применения и идеальные сценарии использования#

Выбор между YOLOv7 и YOLO11 полностью зависит от масштаба проекта и ограничений при развертывании.

Когда стоит рассмотреть YOLOv7:

  • Бенчмаркинг устаревших моделей: Академические исследователи, изучающие дизайн путей градиентов, могут использовать YOLOv7 в качестве базовой линии для оценки более новых convolutional neural networks.
  • Существующие кастомные конвейеры: Команды с сильно кастомизированными конвейерами на C++ или CUDA, созданными специально вокруг уникальной логики декодирования bounding box YOLOv7.

Когда стоит выбрать YOLO11:

  • Коммерческое производство: Приложения в smart retail или healthcare diagnostics получают большую выгоду от поддерживаемой кодовой базы и высокой стабильности YOLO11.
  • Среды с ограниченными ресурсами: Легковесный след YOLO11n делает ее исключительно подходящей для развертывания на мобильных и периферийных (edge) устройствах через ONNX.
  • Многозадачные проекты: Если одному приложению нужно идентифицировать человека, сопоставить его скелет (pose) и сегментировать объект, который он держит, YOLO11 предоставляет единое решение.

Link to this sectionПередовой край: Движение вперед с YOLO26#

Хотя YOLO11 остается очень надежным выбором, инновации в искусственном интеллекте не стоят на месте. Инженерам, начинающим новые проекты сегодня, настоятельно рекомендуется изучить Ultralytics YOLO26.

Выпущенная в январе 2026 года, YOLO26 представляет NMS-Free Design, работающий от начала до конца, полностью устраняя узкие места задержки, связанные с пост-обработкой Non-Maximum Suppression. Кроме того, YOLO26 включает революционный оптимизатор MuSGD Optimizer, вдохновленный методологиями обучения LLM, для обеспечения более быстрой сходимости. Благодаря целевым улучшениям функции потерь с помощью ProgLoss + STAL и инференсу на CPU, работающему до 43% быстрее за счет удаления DFL, YOLO26 специально оптимизирована для периферийных вычислений и представляет собой текущую вершину AI в области компьютерного зрения.

Узнай больше о YOLO26

Для пользователей, интересующихся специализированными альтернативными структурами, изучение RT-DETR на основе трансформеров или динамических моделей с открытым словарем YOLO-World также может дать полезные результаты для разнообразных задач компьютерного зрения.

Контрибьюторы

Комментарии