Перейти к содержанию

Сравнение моделей: выберите лучшую модель обнаружения объектов для вашего проекта

Выбор правильной архитектуры нейронной сети является краеугольным камнем любого успешного проекта компьютерного зрения. Добро пожаловать в Центр сравнения моделей Ultralytics! Эта страница объединяет подробные технические анализы и бенчмарки производительности, анализируя компромиссы между новейшей Ultralytics YOLO26 и другими ведущими архитектурами, такими как YOLO11, YOLOv10, RT-DETR и EfficientDet.

Независимо от того, требует ли ваше приложение миллисекундной задержки периферийного AI или высокой точности, необходимой для медицинской визуализации, это руководство предоставляет основанные на данных сведения, необходимые для принятия обоснованного решения. Мы оцениваем модели на основе средней точности (mAP), скорости инференса, эффективности параметров и простоты развертывания.

Интерактивные сравнительные тесты производительности

Визуализация взаимосвязи между скоростью и точностью необходима для определения «границы Парето» object detection — моделей, которые обеспечивают наилучшую точность при заданном ограничении скорости. На диаграмме ниже сравниваются ключевые метрики на стандартных наборах данных, таких как COCO.

Эта диаграмма визуализирует ключевые показатели производительности, позволяя быстро оценить компромиссы между различными моделями. Понимание этих метрик имеет основополагающее значение для выбора модели, которая соответствует вашим конкретным ограничениям развертывания.

Краткое руководство по принятию решений

Не знаете, с чего начать? Используйте это дерево решений, чтобы сузить выбор архитектуры, которая лучше всего соответствует вашим требованиям к аппаратному обеспечению и производительности.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

Текущее положение дел: YOLO26 и далее

Область обнаружения объектов развивается стремительно. В то время как старые модели остаются актуальными для поддержки устаревших систем, новые архитектуры расширяют границы возможного.

Ultralytics YOLO26

Выпущенная в январе 2026 года, YOLO26 является новейшей передовой моделью и рекомендуемой отправной точкой для всех новых проектов. Она представляет новаторские архитектурные инновации, включая сквозную архитектуру без NMS, которая устраняет необходимость в постобработке Non-Maximum Suppression, что приводит к более быстрому и предсказуемому времени инференса. YOLO26 до 43% быстрее на CPU по сравнению с предыдущими поколениями, что делает ее идеальной для развертывания на периферийных устройствах.

Ключевые инновации включают:

  • Сквозная архитектура без NMS: Упрощенное развертывание без необходимости постобработки
  • Удаление DFL: Оптимизированный экспорт в ONNX, TensorRT и CoreML
  • Оптимизатор MuSGD: Гибридный оптимизатор SGD/Muon, вдохновленный обучением LLM для стабильной сходимости
  • ProgLoss + STAL: Улучшенная производительность обнаружения мелких объектов

Почему стоит выбрать YOLO26?

YOLO26 представляет собой вершину инженерной мысли Ultralytics, сочетая лучшее от эффективности CNN со сквозными возможностями, подобными трансформерам. Она поддерживает все задачи — detect, сегментацию, оценку позы, классификацию и obb — при этом будучи меньше, быстрее и проще в развертывании, чем когда-либо прежде.

Ultralytics YOLO11

YOLO11 остается высокопроизводительной моделью, предлагая сокращение параметров на 22% по сравнению с YOLOv8 при одновременном повышении точности detect. Она полностью поддерживается и рекомендуется для пользователей, которым нужна проверенная стабильность или у которых есть существующие конвейеры YOLO11.

Модели сообщества: Заметка о YOLO12 и YOLO13

Вы можете встретить упоминания о YOLO12 или YOLO13 в обсуждениях сообщества или репозиториях.

Предупреждение для Production

В настоящее время мы не рекомендуем YOLO12 или YOLO13 для использования в production.

  • YOLO12: Использует слои внимания, которые часто вызывают нестабильность обучения, чрезмерное потребление памяти и значительное снижение скорости инференса на CPU.
  • YOLO13: Результаты тестов показывают лишь незначительное увеличение точности по сравнению с YOLO11, при этом модель больше и медленнее. Сообщаемые результаты показали проблемы с воспроизводимостью.



Смотреть: Сравнение моделей YOLO: Ultralytics YOLO11 против YOLOv10 против YOLOv9 против Ultralytics YOLOv8

Подробные сравнения моделей

Изучите наши подробные технические сравнения, чтобы понять конкретные архитектурные различия, такие как выбор backbone, дизайн head и функции потерь. Мы организовали их по моделям для облегчения доступа:

YOLO26 против

YOLO26 — это новейшая модель Ultralytics с поддержкой сквозного detect без NMS, оптимизатором MuSGD и до 43% более быстрым инференсом на CPU. Она оптимизирована для развертывания на периферийных устройствах, достигая при этом передовой точности.

YOLO11 против

YOLO11 опирается на успех своих предшественников благодаря передовым исследованиям. Она имеет улучшенный backbone и архитектуру neck для лучшего извлечения признаков и оптимизированной эффективности.

YOLOv10 против

YOLOv10, разработанная Университетом Цинхуа, направлена на удаление шага Non-Maximum Suppression (NMS) для уменьшения дисперсии задержки, предлагая современную производительность со сниженными вычислительными затратами.

YOLOv9 против

YOLOv9 представляет Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN) для решения проблемы потери информации в глубоких нейронных сетях.

YOLOv8 против

Ultralytics YOLOv8 остается очень популярным выбором, отличаясь продвинутой архитектурой backbone и neck, а также anchor-free split head для оптимального компромисса между точностью и скоростью.

YOLOv7 против

YOLOv7 представила «обучаемые бесплатные улучшения» и повторную параметризацию модели, сосредоточив внимание на оптимизации процесса обучения без увеличения затрат на вывод.

YOLOv6 против

YOLOv6 от Meituan разработан для промышленного применения и включает модули Bi-directional Concatenation (BiC) и стратегии обучения с использованием anchor.

YOLOv5 против

Ultralytics YOLOv5 ценится за простоту использования, стабильность и скорость. Он остается надежным выбором для проектов, требующих широкой совместимости с устройствами.

RT-DETR против

RT-DETR (Real-Time Detection Transformer) использует vision transformers для достижения высокой точности с производительностью в реальном времени, превосходно справляясь с пониманием глобального контекста.

PP-YOLOE+ против

PP-YOLOE+, разработанный Baidu, использует Task Alignment Learning (TAL) и decoupled head для баланса эффективности и точности.

DAMO-YOLO против

DAMO-YOLO от Alibaba Group использует Neural Architecture Search (NAS) и эффективный RepGFPN для максимизации точности на статических бенчмарках.

YOLOX против

YOLOX, разработанный Megvii, представляет собой эволюцию anchor-free, известную своей разделенной головой и стратегией назначения меток SimOTA.

EfficientDet в сравнении с

EfficientDet от Google Brain использует составное масштабирование и BiFPN для оптимизации эффективности параметров, предлагая спектр моделей (D0-D7) для различных ограничений.

Этот индекс постоянно обновляется по мере выпуска новых моделей и уточнения эталонных показателей. Мы рекомендуем вам изучить эти ресурсы, чтобы найти идеальное решение для вашего следующего проекта в области компьютерного зрения. Если вы ищете решения корпоративного уровня с частным лицензированием, посетите нашу страницу лицензирования. Удачного сравнения!


Комментарии