YOLO11 против YOLOv5: всестороннее техническое сравнение архитектур Ultralytics

Выбор подходящей архитектуры нейронной сети — важнейшее решение для любого проекта в области компьютерного зрения. По мере развития искусственного интеллекта совершенствуются и инструменты, доступные разработчикам и исследователям. Это подробное руководство представляет собой глубокое техническое сравнение двух знаковых моделей из экосистемы Ultralytics: легендарной YOLOv5 и передовой YOLO11.

Независимо от того, разворачиваешь ли ты легковесные модели для приложений периферийного ИИ или обрабатываешь потоковое видео высокого разрешения на облачных GPU, понимание архитектурных нюансов, метрик производительности и идеальных сценариев использования этих моделей поможет тебе сделать выбор, основанный на данных, с учетом твоих специфических ограничений при развертывании.

Происхождение моделей и технические детали

Обе модели отражают стремление Ultralytics к сотрудничеству в рамках открытого исходного кода, высокой производительности и непревзойденной простоте использования, что делает их крайне востребованными в мировом сообществе машинного обучения.

Подробности о YOLO11

Узнай больше о YOLO11

Подробности о YOLOv5

Узнай больше о YOLOv5

Архитектурные различия

Эволюция от YOLOv5 к YOLO11 привнесла несколько серьезных архитектурных изменений, направленных на оптимизацию точности и эффективности параметров.

YOLOv5 стала первопроходцем в экосистеме PyTorch, представив высокооптимизированный бэкбон CSPNet (Cross Stage Partial Network) и нек PANet (Path Aggregation Network). Она опиралась на обнаружение на основе якорей (anchor-based), требующее предопределенных якорных рамок для предсказания границ объектов. Несмотря на высокую эффективность, настройка этих якорей для пользовательских наборов данных компьютерного зрения могла быть затруднительной.

В отличие от нее, YOLO11 переходит к более современной парадигме обнаружения без якорей (anchor-free). Это исключает необходимость ручной настройки якорных рамок, упрощая процесс обучения и улучшая обобщающую способность на различных наборах данных, таких как COCO dataset. Кроме того, YOLO11 оснащена разделенной «головой» (decoupled head), что означает обработку задач классификации и регрессии ограничивающих рамок в отдельных ветвях. Такое разделение значительно ускоряет сходимость и среднюю точность (mAP), особенно в сложных сценариях обнаружения объектов.

Метрики производительности и бенчмарки

В таблице ниже представлены ключевые показатели для моделей разных размеров. Модели Ultralytics славятся своими требованиями к памяти: во время обучения они обычно потребляют меньше памяти CUDA по сравнению с тяжелыми альтернативами на базе Transformer, что значительно снижает порог вхождения для оборудования.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Как видишь, YOLO11 достигает оптимального баланса производительности, неизменно демонстрируя более высокие показатели mAP при сопоставимом количестве параметров по сравнению с аналогами из линейки YOLOv5.

Методологии обучения и удобство использования

Один из ключевых принципов философии Ultralytics — исключительная простота использования, поддерживаемая хорошо развитой экосистемой и широким сообществом.

YOLOv5 исторически опиралась на надежные скрипты интерфейса командной строки (CLI) (train.py, detect.py) для выполнения задач. Хотя они мощные, их прямая интеграция в собственные Python-приложения часто требовала обходных путей.

YOLO11 произвела революцию в этом, представив оптимизированный пакет ultralytics для Python. Этот унифицированный API позволяет выполнять все действия, от обучения до экспорта моделей в такие форматы, как ONNX, OpenVINO и TensorRT, «из коробки».

Оптимизированное развертывание с платформой Ultralytics

Для работы в режиме «без кода» ты можешь использовать Ultralytics Platform, чтобы размечать данные, обучать модели в облаке и беспрепятственно развертывать их на периферийных устройствах.

Сравнение кода

Сегодня обучение модели Ultralytics невероятно эффективно. Вот как можно обучить YOLO11 с помощью встроенного Python API:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the model to ONNX for deployment
model.export(format="onnx")

Для устаревших систем, использующих YOLOv5, обучение через CLI выглядит так:

# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt

python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt

Идеальные варианты использования и реальные приложения

Обе модели обладают уникальными сильными сторонами, адаптированными под разные рабочие среды.

Когда использовать YOLOv5

Несмотря на появление нового поколения, YOLOv5 остается мощным инструментом. Мы настоятельно рекомендуем её для:

  • Интеграции с устаревшими системами: среды, глубоко интегрированные со специфическими тензорными структурами или конвейерами развертывания YOLOv5, которые сложно переработать.
  • Академических базовых показателей: исследователям, которым нужны устоявшиеся, проверенные временем базовые показатели для воспроизводимых академических исследований в области анализа медицинских изображений.

Когда использовать YOLO11

YOLO11 — идеальный выбор для современных производственных конвейеров благодаря своей невероятной универсальности:

Взгляд в будущее: архитектура YOLO26

Хотя YOLO11 является исключительным стандартом, рубеж компьютерного зрения продолжает быстро продвигаться вперед. Разработчикам, ищущим абсолютную вершину эффективности, следует также обратить внимание на новейшую Ultralytics YOLO26 (выпущена в январе 2026 года).

YOLO26 представляет собой колоссальный шаг вперед, специально разработанный как для оптимизации на периферии, так и для масштабирования на уровне предприятия. Ключевые инновации включают:

  • Комплексный дизайн без NMS: YOLO26 является нативно комплексным (end-to-end), устраняя необходимость в постобработке с помощью Non-Maximum Suppression (NMS) для более быстрого и простого развертывания.
  • Удаление DFL: Distribution Focal Loss была удалена для упрощения экспорта модели и повышения совместимости с маломощными устройствами.
  • Оптимизатор MuSGD: инновационный гибрид SGD и Muon, который приносит стабильность обучения LLM в компьютерное зрение для более быстрой сходимости.
  • До 43% более быстрый инференс на CPU: сильно оптимизировано для IoT-развертываний и устройств без выделенных GPU.
  • ProgLoss + STAL: существенно улучшенные функции потерь, которые дают заметные улучшения в распознавании мелких объектов, что жизненно важно для аэрофотосъемки с дронов.

Узнай больше о YOLO26

Резюме

Выбор между YOLO11 и YOLOv5 в конечном итоге зависит от стадии жизненного цикла твоего проекта. Наследие YOLOv5 неоспоримо: она предлагает экстремальную стабильность и колоссальную поддержку сообщества. Однако для любого нового проекта мы настоятельно рекомендуем YOLO11 вместо более старых поколений. Она сочетает в себе передовую точность, исключительно элегантный Python API и меньшие затраты памяти при обучении, закрепляя позицию Ultralytics в авангарде инноваций в области ИИ. Для тех, кто раздвигает границы еще дальше, изучение современной YOLO26 на Ultralytics Platform позволит достичь непревзойденных результатов.

Комментарии