Сравнение моделей: выбери лучшую модель обнаружения объектов для своего проекта

Выбор подходящей архитектуры нейронной сети — это краеугольный камень любого успешного проекта по computer vision. Добро пожаловать в Центр сравнения моделей Ultralytics! Эта страница объединяет подробные технические анализы и показатели производительности, разбирая компромиссы между новейшей Ultralytics YOLO26 и другими ведущими архитектурами, такими как YOLO11, YOLOv10, RT-DETR и EfficientDet.

Независимо от того, требует ли твое приложение миллисекундной задержки edge AI или высокой точности, необходимой для медицинской визуализации, это руководство предоставляет данные, необходимые для принятия обоснованного решения. Мы оцениваем модели на основе mean Average Precision (mAP), inference speed, эффективности параметров и простоты развертывания.

Интерактивные показатели производительности

Визуализация зависимости между скоростью и точностью важна для определения «границы Парето» в обнаружении объектов — моделей, которые предлагают наилучшую точность при заданном ограничении скорости. На графике ниже сопоставляются ключевые метрики на стандартных наборах данных, таких как COCO.

Этот график визуализирует ключевые performance metrics, позволяя тебе быстро оценить компромиссы между различными моделями. Понимание этих метрик необходимо для выбора модели, соответствующей твоим конкретным ограничениям при развертывании.

Руководство по быстрому принятию решений

Не знаешь, с чего начать? Используй это дерево решений, чтобы сузить круг поиска архитектуры, которая лучше всего подходит под твои требования к аппаратному обеспечению и производительности.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

Текущий ландшафт: YOLO26 и далее

Область обнаружения объектов развивается быстро. Хотя старые модели остаются актуальными для поддержки устаревших систем, новые архитектуры расширяют границы возможного.

Ultralytics YOLO26

Выпущенная в январе 2026 года, YOLO26 является новейшей передовой моделью и рекомендуемой отправной точкой для всех новых проектов. Она представляет революционные архитектурные инновации, включая End-to-End NMS-Free Design, который устраняет необходимость в постобработке Non-Maximum Suppression, что приводит к более быстрому и предсказуемому времени логического вывода. YOLO26 работает до 43% быстрее на CPU по сравнению с предыдущими поколениями, что делает её идеальной для развертывания на периферийных устройствах.

Ключевые инновации включают:

  • NMS-Free End-to-End: упрощенное развертывание без необходимости постобработки
  • Удаление DFL: оптимизированные экспорты в ONNX, TensorRT и CoreML
  • Оптимизатор MuSGD: гибридный оптимизатор SGD/Muon, вдохновленный обучением LLM для стабильной сходимости
  • ProgLoss + STAL: улучшенная производительность обнаружения мелких объектов
Почему стоит выбрать YOLO26?

YOLO26 представляет собой вершину инженерной мысли Ultralytics, объединяя лучшую эффективность CNN с возможностями end-to-end, свойственными трансформерам. Она поддерживает все задачи — обнаружение, сегментацию, оценку позы, классификацию и OBB — при этом будучи компактнее, быстрее и проще в развертывании, чем когда-либо прежде.

Ultralytics YOLO11

YOLO11 остается высокоэффективной моделью, предлагая сокращение количества параметров на 22% по сравнению с YOLOv8 при улучшении точности обнаружения. Она полностью поддерживается и рекомендуется пользователям, которым нужна проверенная стабильность или у которых уже есть существующие конвейеры YOLO11.

Модели сообщества: заметка о YOLO12 и YOLO13

Ты можешь встретить упоминания о YOLO12 или YOLO13 в обсуждениях сообщества или репозиториях.

Предостережение для продакшена

Мы в настоящее время не рекомендуем использовать YOLO12 или YOLO13 в продакшене.

  • YOLO12: использует слои внимания, которые часто вызывают нестабильность обучения, чрезмерное потребление памяти и значительно более медленную скорость вывода на CPU.
  • YOLO13: тесты показывают лишь незначительный прирост точности по сравнению с YOLO11 при том, что модель больше и медленнее. Сообщенные результаты демонстрируют проблемы с воспроизводимостью.


Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

Подробное сравнение моделей

Изучи наши глубокие технические сравнения, чтобы понять конкретные архитектурные различия, такие как выбор бэкбона, дизайн головы и функции потерь. Мы систематизировали их по моделям для удобства доступа:

YOLO26 против

YOLO26 — это новейшая модель Ultralytics с обнаружением end-to-end без NMS, оптимизатором MuSGD и до 43% более быстрым выводом на CPU. Она оптимизирована для развертывания на периферийных устройствах, обеспечивая при этом передовую точность.

YOLO11 против

YOLO11 опирается на успех своих предшественников благодаря передовым исследованиям. Она оснащена улучшенной архитектурой бэкбона и шеи для лучшего извлечения признаков и оптимизированной эффективности.

YOLOv10 против

Разработанная Университетом Цинхуа, YOLOv10 фокусируется на устранении шага Non-Maximum Suppression (NMS) для уменьшения дисперсии задержки, предлагая передовую производительность с меньшими вычислительными затратами.

YOLOv9 против

YOLOv9 представляет Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN) для борьбы с потерей информации в глубоких нейронных сетях.

YOLOv8 против

Ultralytics YOLOv8 остается очень популярным выбором, обладая продвинутыми архитектурами бэкбона и шеи, а также split-head без анкоров для достижения оптимального баланса точности и скорости.

YOLOv7 против

В YOLOv7 представлены «обучаемые наборы бесплатных улучшений» (trainable bag-of-freebies) и репараметризация моделей, что позволяет оптимизировать процесс обучения без увеличения затрат на инференс.

YOLOv6 против

YOLOv6 от Meituan разработан для промышленных задач и использует модули Bi-directional Concatenation (BiC) и стратегии обучения с использованием якорей (anchor-aided).

YOLOv5 против

Ultralytics YOLOv5 славится своей простотой использования, стабильностью и скоростью. Он остается надежным выбором для проектов, требующих широкой совместимости с устройствами.

RT-DETR против

RT-DETR (Real-Time Detection Transformer) использует трансформеры компьютерного зрения для достижения высокой точности при работе в реальном времени, превосходя другие модели в понимании глобального контекста.

PP-YOLOE+ против

PP-YOLOE+, разработанная компанией Baidu, использует Task Alignment Learning (TAL) и разделенную «голову» (decoupled head) для баланса между эффективностью и точностью.

DAMO-YOLO против

Разработанная в Alibaba Group, DAMO-YOLO использует нейроархитектурный поиск (NAS) и эффективный RepGFPN для достижения максимальной точности на статических бенчмарках.

YOLOX против

YOLOX, разработанная компанией Megvii, представляет собой эволюцию без использования якорей (anchor-free), известную своей разделенной «головой» и стратегией назначения меток SimOTA.

EfficientDet против

EfficientDet от Google Brain использует составное масштабирование и BiFPN для оптимизации использования параметров, предлагая спектр моделей (D0-D7) для различных ограничений.

Этот индекс постоянно обновляется по мере выхода новых моделей и уточнения бенчмарков. Исследуй эти ресурсы, чтобы подобрать идеальное решение для своего следующего проекта в области компьютерного зрения. Если ты ищешь решения корпоративного уровня с частным лицензированием, пожалуйста, посети нашу страницу лицензирования. Удачного сравнения!

Комментарии