Перейти к содержанию

YOLOv5 против YOLO26: Поколенческий скачок в обнаружении объектов в реальном времени.

Эволюция компьютерного зрения определяется постоянным стремлением к созданию более быстрых, точных и доступных моделей. Сравнивая Ultralytics YOLOv5 с передовой Ultralytics YOLO26, мы видим смену парадигмы, которая преодолевает разрыв между надежными устаревшими системами и передовыми решениями современного развертывания ИИ.

Это руководство предоставляет всесторонний технический анализ обеих архитектур, подчеркивая их метрики производительности, структурные различия и идеальные сценарии развертывания.

Обзоры моделей

YOLOv5: Рабочая лошадка индустрии

Выпущенный в 2020 году, YOLOv5 произвёл революцию в доступности обнаружения объектов. Мигрировав архитектуру нативно в фреймворк PyTorch, он предоставил разработчикам беспрецедентный опыт "от нуля до героя".

YOLOv5 заложил основу для активно поддерживаемой экосистемы Ultralytics. Он представил агрессивные методы аугментации данных, эффективные циклы обучения и высокооптимизированные пути экспорта в периферийные форматы, такие как CoreML и ONNX. Его простота использования и низкие требования к памяти во время обучения сделали его основным инструментом для стартапов и исследователей по всему миру.

Узнайте больше о YOLOv5

YOLO26: Стандарт Vision AI следующего поколения

Перенесемся в январь 2026 года: Ultralytics YOLO26 представляет собой вершину ИИ для зрения в реальном времени. Он нативно интегрирует уроки, извлеченные из промежуточных поколений, таких как YOLOv8 и YOLO11, одновременно внедряя значительные прорывы, вдохновленные обучением больших языковых моделей (LLM).

YOLO26 устанавливает новый стандарт баланса производительности, предлагая передовую точность и будучи специально разработанным для доминирования в сценариях периферийных вычислений.

Узнайте больше о YOLO26

Другие модели Ultralytics

Если вы мигрируете со старой кодовой базы, вам также может быть интересно сравнить YOLOv5 с YOLO11 — моделью предыдущего поколения, которая представила первоначальную поддержку различных задач, таких как оценка позы (Pose Estimation) и ориентированные ограничивающие рамки (OBB).

Архитектурные прорывы в YOLO26

В то время как YOLOv5 полагается на детекционные головы на основе якорей и стандартные функции потерь, YOLO26 полностью перерабатывает внутреннюю механику для устранения узких мест развертывания.

  1. Сквозная архитектура без NMS: Наиболее существенное отличие — это изначально сквозная архитектура YOLO26. В отличие от YOLOv5, который требует ручного подавления немаксимумов (NMS) для фильтрации избыточных ограничивающих рамок, YOLO26 полностью исключает этот этап постобработки. Это обеспечивает детерминированную задержку инференса и значительно упрощает интеграцию в C++ или встраиваемое оборудование.
  2. Удаление DFL: YOLO26 удаляет Distribution Focal Loss (DFL). Это архитектурное решение значительно упрощает экспорт модели и повышает совместимость с маломощными периферийными устройствами и микроконтроллерами, которые часто испытывают трудности со сложными операторами.
  3. MuSGD Optimizer: Вдохновленный Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD, гибрид SGD и Muon. Это переносит стабильность и быструю сходимость, наблюдаемые при обучении LLM, в компьютерное зрение, что приводит к снижению потребления памяти и ускорению циклов обучения по сравнению с моделями, интенсивно использующими трансформеры.
  4. ProgLoss + STAL: YOLO26 использует сложные функции ProgLoss и STAL, значительно улучшая его способность detect мелкие и плотные объекты — историческую проблему для YOLOv5.

Сравнение производительности

При сравнении моделей на наборе данных COCO YOLO26 демонстрирует значительные улучшения в точности (mAP), одновременно сокращая количество параметров и увеличивая скорость инференса на CPU.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Примечание: YOLO26 Nano (YOLO26n) достигает впечатляющего mAP в 40.9 по сравнению с 28.0 mAP у YOLOv5n, при этом обеспечивая до 43% более быструю инференцию на CPU благодаря удалению DFL и отсутствию NMS в головной части.

Универсальность и поддержка задач

YOLOv5 в первую очередь известен своим detect объектов. Хотя более поздние обновления представили базовую segmentation, YOLO26 был разработан с нуля как унифицированный многозадачный движок.

YOLO26 изначально поддерживает:

  • Сегментация экземпляров: С использованием многомасштабных прототипов, специфичных для задачи, и функции потерь семантической сегментации.
  • Оценка позы: Использование оценки остаточного логарифмического правдоподобия (RLE) для высокоточного detect ключевых точек.
  • Ориентированные ограничивающие рамки (OBB): Включает специализированную функцию потерь угла для решения проблем разрыва границ, что критически важно для анализа спутниковых изображений.
  • Классификация изображений: Стандартная категоризация изображений целиком.

Интеграция в экосистему

Обе модели выигрывают от платформы Ultralytics, обеспечивая бесшовную аннотацию данных, автоматическую настройку гиперпараметров и развертывание в облаке в один клик. Однако YOLO26 в полной мере использует современные структуры API.

Примеры использования и кода

Ultralytics Python API делает переключение между моделями невероятно простым. Поскольку обе модели используют одну и ту же хорошо поддерживаемую экосистему, обновление устаревшего конвейера YOLOv5 до YOLO26 требует лишь изменения файла весов.

Пример на Python

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Пример CLI

Вы можете развернуть YOLO26 непосредственно через командную строку, используя интеграцию с TensorRT для максимальной пропускной способности GPU:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Идеальные варианты использования

Когда стоит выбрать YOLO26

Для любого современного проекта компьютерного зрения YOLO26 является бесспорной рекомендацией.

  • Периферийный ИИ и IoT: Его на 43% более быстрый вывод на CPU и удаление DFL делают его идеальным для развертывания на Raspberry Pi или мобильных устройствах.
  • Высокоскоростные конвейеры: Архитектура без NMS обеспечивает стабильную, предсказуемую задержку, что критически важно для автономной робототехники и систем охранной сигнализации реального времени.
  • Сложные сценарии: Если ваше приложение требует отслеживания (track) мелких объектов (например, мониторинг дронами) или вращающихся объектов (OBB), расширенные функции потерь YOLO26 (ProgLoss + STAL) обеспечивают значительное преимущество в точности.

Когда следует выбирать YOLOv5

  • Устаревшие системы: Если ваша производственная среда имеет жестко закодированные зависимости от специфической генерации якорей YOLOv5 или логики парсинга NMS, миграция может потребовать короткого периода рефакторинга.
  • Конкретные академические эталоны: Исследователи часто используют YOLOv5 в качестве классического эталона для демонстрации исторического развития архитектур detect объектов.

Обзор

Переход от YOLOv5 к YOLO26 — это не просто итеративное обновление; это фундаментальный скачок в том, как обучаются и развертываются модели object detect. Используя оптимизатор MuSGD, отказываясь от сложной постобработки благодаря NMS-free архитектуре и значительно ускоряя скорости CPU, Ultralytics YOLO26 обеспечивает бескомпромиссный баланс скорости и точности.

Хотя YOLOv5 всегда будет помниться как модель, которая демократизировала ИИ для компьютерного зрения, разработчики, стремящиеся создавать надежные, готовые к производству и перспективные приложения, должны уверенно строить их на основе YOLO26.


Комментарии