Перейти к содержанию

YOLO26 против YOLOv10: Сравнение сквозных моделей обнаружения объектов

Ландшафт компьютерного зрения постоянно развивается, движимый спросом на более быстрые, точные и эффективные модели. Это руководство представляет всестороннее техническое сравнение между двумя новаторскими архитектурами в области обнаружения объектов в реальном времени: YOLO26 и YOLOv10. Анализируя их архитектуры, метрики производительности и возможности развертывания, мы стремимся помочь разработчикам и исследователям выбрать оптимальную модель для их приложений компьютерного зрения.

Эволюция архитектур без NMS

В течение многих лет семейство YOLO (You Only Look Once) в значительной степени полагалось на Non-Maximum Suppression (NMS) для отфильтровывания избыточных ограничивающих рамок во время постобработки. Хотя NMS эффективен, он вносит задержку вывода и усложняет развертывание на периферийных устройствах, таких как Raspberry Pi или специализированные нейронные процессоры (NPU).

Внедрение YOLOv10 ознаменовало смену парадигмы, став пионером в разработке сквозной архитектуры без NMS. Опираясь на этот фундаментальный прорыв, Ultralytics YOLO26 усовершенствовала архитектуру для производственных сред, достигнув беспрецедентной эффективности и простоты использования для широкого круга задач.

Узкое место постобработки

Удаление NMS устраняет динамический, зависящий от данных этап постобработки, который традиционно препятствовал оптимизации моделей компьютерного зрения на аппаратных ускорителях, таких как TensorRT и OpenVINO.

YOLOv10: Пионерское обнаружение без NMS

Дата: 2024-05-23
Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
Организация:Университет Цинхуа
Ресурсы:Статья на ArXiv | Репозиторий GitHub

Разработанный исследователями Университета Цинхуа, YOLOv10 представил согласованную стратегию двойного назначения для устранения необходимости в NMS. Применяя целостный подход к проектированию модели, ориентированный на эффективность и точность, он сократил вычислительную избыточность, сохраняя при этом высокий mAP (среднюю точность).

Преимущества:

  • NMS-свободная архитектура: Оригинальный пионер NMS-свободного дизайна в серии YOLO, значительно снижающий задержку для приложений реального времени.
  • Эффективность: Обеспечивает оптимальный баланс между количеством параметров и скоростью инференса по сравнению с моделями предыдущих поколений.

Слабые стороны:

  • Ограниченная поддержка задач: В основном ориентирован на стандартное обнаружение объектов, без нативной поддержки "из коробки" для продвинутых задач, таких как segment или оценка позы.
  • Академическая направленность: Кодовая база, хотя и надежная, больше ориентирована на исследования, чем на оптимизированное развертывание в производственной среде корпоративного уровня.

Узнайте больше о YOLOv10

YOLO26: Новый стандарт для периферийных и облачных вычислений

Дата: 2026-01-14
Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Ресурсы:Репозиторий GitHub | Платформа Ultralytics

Выпущенный как преемник YOLO11, YOLO26 доводит концепцию без NMS до ее окончательной реализации. Он нативно интегрирует сквозное detect в высокооптимизированную Ultralytics Platform, предоставляя полный набор инструментов для современного конвейера машинного обучения.

YOLO26 представляет несколько архитектурных прорывов:

  • Удаление DFL: Distribution Focal Loss была полностью удалена. Это значительно упрощает процесс экспорта модели и улучшает совместимость с периферийными и маломощными устройствами.
  • До 43% более быстрый инференс на CPU: Благодаря удалению DFL и структурным оптимизациям YOLO26 значительно быстрее на CPU, что делает его идеальным для развертывания в IoT и на мобильных устройствах.
  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (LLM) (таких как Kimi K2 от Moonshot AI), YOLO26 использует гибрид SGD и Muon. Это обеспечивает беспрецедентную стабильность обучения и более быструю сходимость в задачах компьютерного зрения.
  • ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что критически важно для аэроснимков и мониторинга безопасности с помощью дронов.
  • Специализированные улучшения: YOLO26 — это не просто детектор. Он включает функцию потерь семантической сегментации и многомасштабный прототип для сегментации, оценку остаточного логарифмического правдоподобия (RLE) для оценки позы и специализированную угловую функцию потерь для ориентированных ограничивающих рамок (OBB).

Узнайте больше о YOLO26

Анализ производительности и метрики

В следующей таблице сравнивается производительность detect на COCO для моделей YOLO26 и YOLOv10. Обратите внимание, как YOLO26 достигает превосходной точности при сохранении исключительной эффективности по параметрам.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Преимущества Ultralytics: Эффективность обучения и использования памяти

При развертывании моделей в продакшене требования к памяти и эффективность обучения так же важны, как и скорость инференса. Модели Ultralytics, в частности YOLO26, высоко оптимизированы для снижения использования памяти CUDA во время обучения. Это позволяет разработчикам использовать более крупные размеры батчей на потребительских GPU, значительно сокращая время обучения и вычислительные затраты. Напротив, сложные архитектуры или тяжелые трансформерные модели, такие как RT-DETR, часто требуют дорогостоящего высокопроизводительного оборудования для эффективного обучения.

Непрерывная интеграция и экосистема

Одним из величайших преимуществ выбора YOLO26 является ее интеграция с хорошо поддерживаемой экосистемой Ultralytics. От разметки данных до отслеживания экспериментов, платформа предоставляет все, что нужно инженеру машинного обучения, под одной унифицированной крышей.

Практическая реализация: Пример кода

Отличительной чертой Ultralytics является ведущая в отрасли простота использования. Благодаря интуитивно понятному API на python, переход от устаревшей модели, такой как YOLOv8, к передовой YOLO26 требует обновления всего одной строки кода.

Вот полностью рабочий пример, демонстрирующий, как обучать и выполнять инференс с использованием YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Сценарии использования и рекомендации

Выбор между YOLO26 и YOLOv10 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда выбирать YOLO26

YOLO26 является отличным выбором для:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Когда выбирать YOLOv10

YOLOv10 рекомендуется для:

  • Обнаружение в реальном времени без NMS: Приложения, выигрывающие от сквозного обнаружения без Non-Maximum Suppression, что снижает сложность развертывания.
  • Сбалансированный компромисс между скоростью и точностью: Проекты, требующие оптимального баланса между скоростью инференса и точностью обнаружения для моделей различных масштабов.
  • Приложения с предсказуемой задержкой: Сценарии развертывания, где критически важны предсказуемые времена инференса, например, в робототехнике или автономных системах.

Заключение

Хотя YOLOv10 внесла значительный вклад в академическое сообщество, представив парадигму без NMS, YOLO26 поднимает эту технологию до уровня готовности к корпоративному использованию. Благодаря значительному увеличению скорости CPU на 43%, инновационному оптимизатору MuSGD и непревзойденной универсальности в задачах компьютерного зрения, YOLO26 выделяется как лучший выбор как для граничных вычислений, так и для крупномасштабных облачных развертываний.

Для команд, которые ценят активное сообщество, исчерпывающую документацию и беспроблемный опыт разработчика, экосистема Ultralytics не имеет себе равных. Если вы изучаете модели для специализированных сценариев, вы также можете рассмотреть YOLO-World для обнаружения объектов с открытым словарем без предварительного обучения. Однако для подавляющего большинства реальных случаев использования YOLO26 является окончательной рекомендацией.


Комментарии