YOLO26 против YOLOv10: сравнение комплексных моделей обнаружения объектов

Ландшафт компьютерного зрения постоянно меняется, подпитываемый спросом на более быстрые, точные и эффективные модели. Это руководство содержит полное техническое сравнение двух прорывных архитектур в области обнаружения объектов в реальном времени: YOLO26 и YOLOv10. Анализируя их архитектуры, показатели производительности и возможности развертывания, мы стремимся помочь разработчикам и исследователям выбрать оптимальную модель для их приложений машинного зрения.

Эволюция архитектур без использования NMS

В течение многих лет семейство YOLO (You Only Look Once) сильно зависело от Non-Maximum Suppression (NMS) для фильтрации избыточных ограничивающих рамок во время постобработки. Несмотря на эффективность, NMS увеличивает задержку вывода и усложняет развертывание на периферийных устройствах, таких как Raspberry Pi или специализированные нейронные процессоры (NPU).

Появление YOLOv10 стало сменой парадигмы, открыв путь к комплексному дизайну без NMS. Основываясь на этом фундаментальном прорыве, Ultralytics YOLO26 усовершенствовала архитектуру для производственных сред, достигнув беспрецедентной эффективности и простоты использования в более широком спектре задач.

Узкое место постобработки

Удаление NMS исключает динамический, зависящий от данных этап постобработки, который традиционно препятствовал оптимизации моделей компьютерного зрения на аппаратных ускорителях, таких как TensorRT и OpenVINO.

YOLOv10: пионер обнаружения без NMS

Дата: 2024-05-23
Авторы: Ao Wang, Hui Chen, Lihao Liu и др.
Организация: Tsinghua University
Ресурсы: ArXiv Paper | GitHub Repository

Разработанная исследователями из Университета Цинхуа, YOLOv10 представила последовательную стратегию двойного назначения, чтобы устранить необходимость в NMS. Используя целостный дизайн модели, основанный на эффективности и точности, она сократила вычислительную избыточность, сохранив при этом высокие показатели mAP (mean Average Precision).

Сильные стороны:

  • Архитектура без NMS: Изначальный пионер дизайна без NMS в серии YOLO, радикально сокращающий задержку для приложений реального времени.
  • Эффективность: Предлагает отличное соотношение количества параметров и скорости вывода по сравнению с моделями предыдущего поколения.

Слабые стороны:

  • Ограниченная поддержка задач: В основном ориентирована на стандартное обнаружение объектов, не хватает встроенной поддержки расширенных задач, таких как сегментация или оценка позы.
  • Академическая направленность: Кодовая база, хотя и надежная, больше склоняется к исследованиям, а не к оптимизированному развертыванию промышленного уровня.

Узнать больше о YOLOv10

YOLO26: новый стандарт для Edge и Cloud

Дата: 2026-01-14
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Ресурсы: GitHub Repository | Ultralytics Platform

Выпущенная как преемник YOLO11, YOLO26 доводит концепцию без NMS до логического завершения. Она нативно интегрирует комплексное обнаружение в высокооптимизированную Ultralytics Platform, предоставляя полный набор инструментов для современного конвейера машинного обучения.

YOLO26 представляет несколько архитектурных прорывов:

  • Удаление DFL: Distribution Focal Loss была полностью удалена. Это значительно упрощает процесс экспорта модели и улучшает совместимость с периферийными и маломощными устройствами.
  • До 43% более быстрый вывод на CPU: Благодаря удалению DFL и структурным оптимизациям, YOLO26 значительно быстрее работает на процессорах, что делает ее идеальной для развертывания в IoT и мобильных средах.
  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (LLM) (такими как Kimi K2 от Moonshot AI), YOLO26 использует гибрид SGD и Muon. Это обеспечивает непревзойденную стабильность обучения и более быструю сходимость для компьютерного зрения.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что критически важно для аэросъемки и мониторинга безопасности с помощью дронов.
  • Улучшения для конкретных задач: YOLO26 — это не просто детектор. Она включает функцию потерь семантической сегментации и multi-scale proto для сегментации, оценку остаточного логарифмического правдоподобия (RLE) для оценки позы и специализированную функцию потерь угла для ориентированных ограничивающих рамок (OBB).

Узнай больше о YOLO26

Анализ производительности и метрики

В следующей таблице сравнивается производительность обнаружения COCO для моделей YOLO26 и YOLOv10. Заметь, как YOLO26 достигает превосходной точности, сохраняя при этом исключительную эффективность параметров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Преимущество Ultralytics: эффективность обучения и памяти

When deploying models into production, memory requirements and training efficiency are just as crucial as inference speed. Ultralytics models, particularly YOLO26, are highly optimized to reduce CUDA memory usage during training. This allows developers to use larger batch sizes on consumer-grade GPUs, drastically cutting down training time and computational costs. Conversely, complex architectures or heavy transformer models like RT-DETR often require expensive, high-end hardware to train effectively.

Непрерывная интеграция и экосистема

Одним из величайших преимуществ выбора YOLO26 является ее интеграция с хорошо поддерживаемой экосистемой Ultralytics. От аннотирования данных до отслеживания экспериментов — платформа предоставляет инженеру по машинному обучению все необходимое под одной крышей.

Практическая реализация: пример кода

Визитной карточкой Ultralytics является лучшая в отрасли простота использования. Благодаря интуитивно понятному Python API, миграция с устаревшей модели, такой как YOLOv8, на передовую YOLO26 требует обновления всего одной строки кода.

Вот 100% рабочий пример, демонстрирующий, как обучать и использовать вывод с помощью YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Варианты использования и рекомендации

Выбор между YOLO26 и YOLOv10 зависит от твоих конкретных требований проекта, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать YOLO26

YOLO26 — отличный выбор, если:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Когда выбирать YOLOv10

YOLOv10 рекомендуется для:

  • Обнаружение в реальном времени без NMS: Приложения, которые выигрывают от комплексного обнаружения без Non-Maximum Suppression, что снижает сложность развертывания.
  • Сбалансированные компромиссы скорости и точности: Проекты, требующие хорошего баланса между скоростью вывода и точностью обнаружения для моделей различных масштабов.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

Заключение

В то время как YOLOv10 внесла значительный вклад в академическое сообщество, представив парадигму без NMS, YOLO26 выводит эту технологию на уровень готовности для корпоративного сектора. Благодаря заметному приросту скорости CPU на 43%, инновационному оптимизатору MuSGD и непревзойденной универсальности в задачах компьютерного зрения, YOLO26 выделяется как идеальный выбор как для периферийных вычислений, так и для крупномасштабных облачных развертываний.

Для команд, которые ценят активное сообщество, полную документацию и удобный опыт разработки, экосистема Ultralytics не имеет себе равных. Если ты изучаешь модели для специализированных сценариев, возможно, стоит рассмотреть YOLO-World для zero-shot обнаружения с открытым словарем. Однако для подавляющего большинства реальных задач YOLO26 является окончательной рекомендацией.

Комментарии