Перейти к содержанию

YOLO26 против YOLOv10: Эволюция сквозного обнаружения объектов

Ландшафт обнаружения объектов в реальном времени быстро развивался, переходя от сложных многостадийных конвейеров к оптимизированным сквозным архитектурам. Две ключевые модели в этом переходе — YOLO26, новейшее передовое решение от Ultralytics, и YOLOv10, академический прорыв Университета Цинхуа.

Хотя обе модели выступают за отказ от Non-Maximum Suppression (NMS) для упрощенного развертывания, они значительно различаются по целям оптимизации, поддержке экосистемы и архитектурным усовершенствованиям. Это руководство представляет собой глубокий технический анализ их различий, чтобы помочь вам выбрать подходящий инструмент для ваших проектов компьютерного зрения.

Ориентиры производительности

Следующая таблица сравнивает производительность YOLO26 и YOLOv10 на валидационном наборе данных COCO. YOLO26 демонстрирует превосходную точность (mAP) и скорость инференса, особенно на аппаратном обеспечении CPU, где она специально оптимизирована для периферийного развертывания.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics YOLO26

YOLO26 представляет собой вершину семейства моделей Ultralytics, выпущенную в январе 2026 года. Опираясь на наследие YOLOv8 и YOLO11, она представляет нативную сквозную архитектуру, которая устраняет необходимость в постобработке NMS, обеспечивая при этом значительный прирост скорости на периферийных устройствах.

Ключевые архитектурные инновации

  • Сквозной инференс без NMS: Как и YOLOv10, YOLO26 устраняет шаг NMS. Это упрощает конвейер развертывания, гарантируя, что выходные данные модели готовы для последующей логики немедленно, снижая вариативность задержки в системах реального времени.
  • Удаление DFL: Архитектура исключает Distribution Focal Loss (DFL). Это изменение значительно упрощает процесс экспорта в такие форматы, как ONNX и TensorRT, и повышает совместимость с маломощным периферийным оборудованием, которое может испытывать трудности со сложными выходными слоями.
  • Оптимизатор MuSGD: Новый оптимизатор обучения, объединяющий Stochastic Gradient Descent (SGD) с Muon (вдохновленный методами обучения LLM от Moonshot AI). Это приводит к более быстрой сходимости и более стабильным процессам обучения по сравнению с традиционными настройками AdamW или SGD.
  • ProgLoss + STAL: Интеграция прогрессивного балансирования потерь (ProgLoss) и присвоения меток с учетом мелких целей (STAL) напрямую устраняет общие недостатки в обнаружении объектов, в частности, улучшая производительность на мелких объектах, встречающихся на аэрофотоснимках или в логистике.

Узнайте больше о YOLO26

Сценарии применения и преимущества

YOLO26 разработана как универсальная модель компьютерного зрения. Помимо обнаружения, она нативно поддерживает сегментацию экземпляров, оценку позы, обнаружение ориентированных ограничивающих рамок (OBB) и классификацию изображений.

Ее оптимизация для инференса на CPU делает ее идеальным выбором для периферийных ИИ-приложений, таких как запуск на Raspberry Pi или мобильных устройствах, где ресурсы GPU недоступны.

Периферийная эффективность

YOLO26 оптимизирована для ускорения инференса на CPU до 43% по сравнению с предыдущими поколениями, что делает ее революционным решением для IoT-устройств с батарейным питанием и встроенных систем.

YOLOv10

YOLOv10, разработанная исследователями из Университета Цинхуа, была пионерской моделью, представившей обучение без NMS для семейства YOLO. Она активно фокусируется на снижении избыточности в головной части модели и устранении вычислительного узкого места постобработки.

Основные характеристики

  • Последовательные двойные присвоения: YOLOv10 использует стратегию двойного присвоения во время обучения — применяя присвоение «один-ко-многим» для богатого надзора и «один-к-одному» для эффективности. Это позволяет эффективно обучать модель, при этом она функционирует в сквозном режиме во время инференса.
  • Комплексный дизайн эффективности: Архитектура использует легковесные классификационные головы и пространственно-канальное декомпозированное понижающее сэмплирование для снижения вычислительных затрат (FLOPs).
  • Блочная архитектура, управляемая рангом: Для повышения эффективности YOLOv10 адаптирует дизайн блоков в зависимости от стадии сети, уменьшая избыточность в более глубоких слоях.

Ограничения

Хотя YOLOv10 инновационна, она в первую очередь является академическим исследовательским проектом. Ей не хватает обширной поддержки задач, присущей YOLO26 (таких как нативные модели OBB или Pose в официальном репозитории), и она не получает такого же уровня непрерывной поддержки и интеграции, как в экосистеме Ultralytics.

Узнайте больше о YOLOv10

Подробное техническое сравнение

Обучение и оптимизация

YOLO26 представляет оптимизатор MuSGD, гибридный подход, который переносит инновации в стабильности из обучения больших языковых моделей (LLM) в компьютерное зрение. Это контрастирует с YOLOv10, которая опирается на стандартные методы оптимизации. Кроме того, YOLO26 использует ProgLoss (Progressive Loss) для динамической корректировки весов потерь во время обучения, гарантируя, что модель фокусируется на более сложных примерах по мере продвижения обучения.

Скорость инференса и развертывание

Обе модели предлагают сквозной вывод, устраняя узкое место NMS. Однако YOLO26 идет дальше, удаляя DFL, что часто усложняет экспорт в CoreML или TFLite. Бенчмарки показывают, что YOLO26 достигает до 43% более быстрого вывода на CPU, подчеркивая его ориентацию на практическое развертывание на периферийных устройствах в реальных условиях, а не только на теоретическое снижение FLOP на GPU.

Универсальность и экосистема

Ultralytics YOLO26 — это не просто модель обнаружения; это платформа. Пользователи могут легко переключаться между такими задачами, как Segmentation, Pose Estimation и OBB, используя один и тот же API.

from ultralytics import YOLO

# Load a YOLO26 model for different tasks
model_det = YOLO("yolo26n.pt")  # Detection
model_seg = YOLO("yolo26n-seg.pt")  # Segmentation
model_pose = YOLO("yolo26n-pose.pt")  # Pose Estimation

# Run inference
results = model_det("image.jpg")

В отличие от этого, YOLOv10 в основном ориентирован на обнаружение объектов, с ограниченной официальной поддержкой этих сложных последующих задач.

Почему стоит выбрать Ultralytics YOLO26?

Для разработчиков и предприятий YOLO26 предлагает более надежное решение:

  1. Простота использования: API Ultralytics на python и CLI являются отраслевыми стандартами простоты. Обучение, валидация и экспорт выполняются одной строкой команд.
  2. Хорошо поддерживаемая экосистема: Ultralytics предоставляет частые обновления, исправления ошибок и активно развивающееся сообщество на Discord и GitHub.
  3. Эффективность обучения: Благодаря доступным предварительно обученным весам для всех задач и размеров, трансферное обучение является быстрым и эффективным, требуя меньше памяти GPU, чем альтернативы на основе трансформеров, такие как RT-DETR.
  4. Готовность к развертыванию: Обширная поддержка форматов экспорта, включая OpenVINO, TensorRT и ONNX, гарантирует работу вашей модели в любом месте.

Заключение

В то время как YOLOv10 стал пионером архитектуры YOLO без NMS, YOLO26 дорабатывает и расширяет эту концепцию, превращая ее в мощное решение, готовое к производству. Благодаря превосходной точности, специализированным оптимизациям для периферийных устройств и всесторонней поддержке задач, YOLO26 является рекомендуемым выбором для современных приложений компьютерного зрения, от аналитики умных городов до мониторинга сельского хозяйства.

Другие модели для изучения

Если вы заинтересованы в изучении других опций в экосистеме Ultralytics, рассмотрите:

  • YOLO11: Надежный предшественник, предлагающий отличную производительность общего назначения.
  • YOLO-World: Для обнаружения с открытым словарем, когда вам нужно detect объекты, отсутствующие в ваших обучающих данных.
  • RT-DETR: Детектор на основе трансформера для сценариев с высокой точностью, где скорость вывода менее критична.

Комментарии